С Новым годом! Форум программистов, компьютерный форум, киберфорум
Python для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.67/6: Рейтинг темы: голосов - 6, средняя оценка - 4.67
0 / 0 / 0
Регистрация: 30.12.2021
Сообщений: 68

Проблема с парсингом текста из docx файла

26.06.2022, 23:00. Показов 1452. Ответов 6

Студворк — интернет-сервис помощи студентам
я не могу разобраться как парсить абсолютно весь текст с docx файла
тот способ где везде описывается не парсит ничего кроме просто строк(мне же нужны впринципе все слова которые есть в файле)
все что я нашёл:
Python
1
2
3
4
5
6
import docx
doc = docx.Document('mydocxfile.docx')
pars = doc.paragraphs
for paragraph in pars:
    texts.append(paragraph.text)
print(texts)
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
26.06.2022, 23:00
Ответы с готовыми решениями:

Проблема различия кодировок txt и docx при переносе текста из одного файла в другой
При реализации конвертера из txt в docx, получаемый файл "повреждён", и ворд отказывается его открывать. Если же наоборот из docx в txt, то...

Чтение текста файла *.docx
Всем привет! У меня такая проблемка - хочу прочесть текст файла *.docx, но вылетает исключение COMException "Приложению Word не...

Оформление текста из файла *.docx
Есть некоторый файл расширением *.docx. Необходимо считать текст в переменную, при этом сохранив оформление текста(т.е. подчеркивание,...

6
Эксперт по компьютерным сетям
 Аватар для Jabbson
5907 / 3359 / 1036
Регистрация: 03.11.2009
Сообщений: 10,008
27.06.2022, 03:52
Это не "API, боты". Думаю, для того, чтобы попытаться Вас помочь нужно хотя бы иметь файл и что именно из него нужно достать.
0
0 / 0 / 0
Регистрация: 30.12.2021
Сообщений: 68
27.06.2022, 04:04  [ТС]
Output (1).docx
вот допустим файл я понял как парсить данные обычного текста и он парсится отлично и заменяется а вот текст в таблице ни парсится и не заменяется кнш
0
Эксперт по компьютерным сетям
 Аватар для Jabbson
5907 / 3359 / 1036
Регистрация: 03.11.2009
Сообщений: 10,008
27.06.2022, 04:10
Python
1
2
3
4
5
6
7
8
import docx
 
doc = docx.Document("Output.docx")
table = doc.tables[0]
 
for row in table.rows:
    for cell in row.cells:
        print(cell.text)
Добавлено через 32 секунды
https://python-docx.readthedoc... table.html
0
0 / 0 / 0
Регистрация: 30.12.2021
Сообщений: 68
27.06.2022, 05:43  [ТС]
а как заменять их?
0
Эксперт по компьютерным сетям
 Аватар для Jabbson
5907 / 3359 / 1036
Регистрация: 03.11.2009
Сообщений: 10,008
27.06.2022, 06:08
Я ссылку послал, там весь api есть либы.

Добавлено через 1 минуту
буквально на первой странице документации есть пример
https://python-docx.readthedoc... index.html
0
0 / 0 / 0
Регистрация: 30.12.2021
Сообщений: 68
27.06.2022, 06:16  [ТС]
не додумал там посмотреть, каюсь, благодарю очень помогли
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
27.06.2022, 06:16
Помогаю со студенческими работами здесь

Проблема с выводом информации из файла .docx в RichTextBox
Доброго времени суток, работаю над программой. Возникла проблема с выводом информации из файла .docx в RichTextBox. В самом файле...

Apache.poi Чтение и извлечение текста из docx файла
Пытаюсь сделать так, чтоб метод читал и выводил на консоль текст документа docx формата. public static void readDocxFile(String...

Считывание информации из файла docx и запись в созданный файл docx
Нужно сделать консольное приложение для считывания информации с docx и запись в созданные файл docx

Проблема с парсингом
Скрипт работает, я вижу парсинг в терминале Но не вижу результаты парсинга в папке 123 проекта Почему? from icrawler.builtin...

Проблема с парсингом
Делаю парсинг сайта для себя. Вот часть функции: for item in cards: cards_name = item.find("div",...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
7
Ответ Создать тему
Новые блоги и статьи
Модель микоризы: классовый агентный подход
anaschu 02.01.2026
Раньше это было два гриба и бактерия. Теперь три гриба, растение. И на уровне агентов добавится между грибами или бактериями взаимодействий. До того я пробовал подход через многомерные массивы,. . .
Учёным и волонтёрам проекта «Einstein@home» удалось обнаружить четыре гамма-лучевых пульсара в джете Млечного Пути
Programma_Boinc 01.01.2026
Учёным и волонтёрам проекта «Einstein@home» удалось обнаружить четыре гамма-лучевых пульсара в джете Млечного Пути Сочетание глобально распределённой вычислительной мощности и инновационных. . .
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост.
Programma_Boinc 28.12.2025
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост. Налог на собак: https:/ / **********/ gallery/ V06K53e Финансовый отчет в Excel: https:/ / **********/ gallery/ bKBkQFf Пост отсюда. . .
Кто-нибудь знает, где можно бесплатно получить настольный компьютер или ноутбук? США.
Programma_Boinc 26.12.2025
Нашел на реддите интересную статью под названием Anyone know where to get a free Desktop or Laptop? Ниже её машинный перевод. После долгих разбирательств я наконец-то вернула себе. . .
Thinkpad X220 Tablet — это лучший бюджетный ноутбук для учёбы, точка.
Programma_Boinc 23.12.2025
Рецензия / Мнение/ Перевод Нашел на реддите интересную статью под названием The Thinkpad X220 Tablet is the best budget school laptop period . Ниже её машинный перевод. Thinkpad X220 Tablet —. . .
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта Симптом: После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
Как объединить две одинаковые БД Access с разными данными
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru