Форум программистов, компьютерный форум, киберфорум
Python для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.77/13: Рейтинг темы: голосов - 13, средняя оценка - 4.77
0 / 0 / 0
Регистрация: 21.07.2020
Сообщений: 1

Программная проверка форматирования документов word

21.07.2020, 12:34. Показов 2798. Ответов 3

Студворк — интернет-сервис помощи студентам
Задача состоит в следующем. Необходимо реализовать автоматическую проверку форматирования документов. Например, что абзацы выровнены по ширине, заголовки пронумерованы и начинаются с табуляции, до и после заголовка отступ, таблицы подписаны сверху (по правому краю), рисунки - снизу (по левому краю), и т.д. и т.п. Сейчас пробую это сделать с помощью python-docx, Проблема в том, что я так и не нашёл в этой библиотеке инструмента, чтоб определить, какое содержимое у абзаца. Например, если воспользоваться методом paragraphs, текст определяется без проблем, а вот таблица уже воспринимается тоже как текст, изображение и вовсе игнорируется. Может посоветуете другую библиотеку (даже на другом языке)? Пробовал на C# что-нибудь подобное найти, но пока безрезультатно. То, есть, повторюсь, мне важно, чтобы можно было по порядку считать из документа абзацы, таблицы и рисунки, т.к. это влияет на условия форматирования.
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
21.07.2020, 12:34
Ответы с готовыми решениями:

Нарушение форматирования документов word 2010 при открытии в word 2013
Здравия коллеги! Столкнулся с такой проблемой у человека W8+office2013 всё легальное, документы от офиса 2010 криво открываются, все!...

Написание программы для проверки проведения параметров форматирования документов Microsoft Word
В общем дело такое, нужно написать программу проверки проведения параметров форматирования документов Microsoft Word. На C#. P.S я...

Ms Word 2019 Сравнение 2-х документов Окна документов
Здравствуйте. Сравниваю разные пары документов. И по глупости закрыл окна с исходными документами и сейчас получаю только одно окно с...

3
Эксперт Python
 Аватар для dondublon
4652 / 2072 / 366
Регистрация: 17.03.2012
Сообщений: 10,182
Записей в блоге: 6
21.07.2020, 12:48
Имхо, зря вы для такой сложной задачи выбрали питон. VBA послужит куда лучше.
0
Эксперт Python
5438 / 3859 / 1215
Регистрация: 28.10.2013
Сообщений: 9,552
Записей в блоге: 1
21.07.2020, 14:03
Цитата Сообщение от Eternal Phoen1x Посмотреть сообщение
Задача состоит в следующем.
Задача едва ли (как замечено выше) решается на уровне сторонних библиотек (они никогда не охватывают весь огромнейший функционал такого приложения как Word).
Только на уровне API Word.Application, доступ к которому можно получить либо через системный COM интерфейс (естественно будет юзаться и запускаться объект самого ворда), либо непосредственно через язык VBA.
0
150 / 120 / 36
Регистрация: 01.11.2019
Сообщений: 425
21.07.2020, 16:25
Вот коротенький код, как прочитать файл

Python
1
2
3
4
5
6
7
8
9
10
11
12
import win32com.client as win32
import os
 
def word(file_docx):
    word = win32.gencache.EnsureDispatch('Word.Application')
    word.Visible = True
    doc = word.Documents.Open(f'{os.getcwd()}\\{file_docx}')
    print(doc.Content.Text)
    doc.Close(False)
    word.Application.Quit()
 
word('test.docx')

Все объекты, методы и свойства описаны тут https://docs.microsoft.com/ru-... rview/word
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
21.07.2020, 16:25
Помогаю со студенческими работами здесь

Наименование документов при переформатировании WORD в PDF через VBA Word
Подскажите пожалуйста, написали макрос который пересохраняет каждый лист WORD документа в PDF. При сохранении необходимо использовать...

Как скопировать данные из документа Word в несколько других документов Word, используя datagridview
В приложении сначала открываю Word документ в котором находится нужная таблица(1.docx), после открытия документа таблица отображается в...

Вывод документов Word без Word и OLE - возможен?
Как же все-таки вывести документ Word в приложении на VB? Ведь если использовать RichTexBox, то 'плывут' таблицы, теряется все...

Открытие документов word без Word
Можно как нормально открывать документы, сделанные на word без word? Если да, то какие проги нужно использовать?

Программная вставка картинки в Word
Друзья! Помогите разобраться. В файле Word имеются слова, которые представляют собой ссылки на графики Excel. Прога должна вместо них...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
4
Ответ Создать тему
Новые блоги и статьи
Камера Toupcam IUA500KMA
Eddy_Em 12.02.2026
Т. к. у всяких "хикроботов" слишком уж мелкий пиксель, для подсмотра в ESPriF они вообще плохо годятся: уже 14 величину можно рассмотреть еле-еле лишь на экспозициях под 3 секунды (а то и больше),. . .
И ясному Солнцу
zbw 12.02.2026
И ясному Солнцу, и светлой Луне. В мире покоя нет и люди не могут жить в тишине. А жить им немного лет.
«Знание-Сила»
zbw 12.02.2026
«Знание-Сила» «Время-Деньги» «Деньги -Пуля»
SDL3 для Web (WebAssembly): Подключение Box2D v3, физика и отрисовка коллайдеров
8Observer8 12.02.2026
Содержание блога Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами и вызывать обработчики событий столкновения. . . .
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 11.02.2026
Содержание блога Библиотека SDL3 содержит встроенные инструменты для базовой работы с изображениями - без использования библиотеки SDL3_image. Пошагово создадим проект для загрузки изображения. . .
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL3_image
8Observer8 10.02.2026
Содержание блога Библиотека SDL3_image содержит инструменты для расширенной работы с изображениями. Пошагово создадим проект для загрузки изображения формата PNG с альфа-каналом (с прозрачным. . .
Установка Qt-версии Lazarus IDE в Debian Trixie Xfce
volvo 10.02.2026
В общем, достали меня глюки IDE Лазаруса, собранной с использованием набора виджетов Gtk2 (конкретно: если набирать текст в редакторе и вызвать подсказку через Ctrl+Space, то после закрытия окошка. . .
SDL3 для Web (WebAssembly): Работа со звуком через SDL3_mixer
8Observer8 08.02.2026
Содержание блога Пошагово создадим проект для загрузки звукового файла и воспроизведения звука с помощью библиотеки SDL3_mixer. Звук будет воспроизводиться по клику мышки по холсту на Desktop и по. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru