Форум программистов, компьютерный форум, киберфорум
Python
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
0 / 0 / 0
Регистрация: 08.12.2015
Сообщений: 53

Парсинг docx таблиц с заголовком

08.09.2022, 07:21. Показов 4145. Ответов 0

Студворк — интернет-сервис помощи студентам
Здравствуйте, есть такой код:
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
from docx.api import Document
 
 
def parser(k):
    document = Document(1.docx)
    print(document)
    table = document.tables[k]
 
    #print(table)
 
    data = []
 
    keys = None
    for i, row in enumerate(table.rows):
        text = (cell.text for cell in row.cells)
 
       
        if i == 0:
            keys = tuple(text)
            continue
 
       
        row_data = dict(zip(text, text))
        data.append(row_data)
У меня много документов, в каждом по 3 таблицы, в таблицах 2 колонки и нет шапки.
Данный код парсит данные так как мне нужно, но не парсит первую строку, видимо предполагая, что это шапка. Помогите исправить...

Добавлено через 41 минуту
Разобрался, всего то навсего нужно было удалить условие...


Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
from docx.api import Document
 
 
def parser(k):
    document = Document(1.docx)
    print(document)
    table = document.tables[k]
 
    #print(table)
 
    data = []
 
    keys = None
    for i, row in enumerate(table.rows):
        text = (cell.text for cell in row.cells)
  
       
        row_data = dict(zip(text, text))
        data.append(row_data)
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
08.09.2022, 07:21
Ответы с готовыми решениями:

Парсинг Docx в PHP
Привет всем. Помогите пожалуйста. Задача в том, чтоб просмотреть текст залитого на сервер Docx файла и проверить его содержимое на...

Парсинг docx документа
Ситуация такая: есть парсер, который парсит docx библиотекой documentformat.openxml. Парсинг берёт все "раны" (теги в xml, в...

Парс таблиц из документа docx
Уже создавал тему, решением стала библиотека docx Щас не могу разобраться, как спарсить таблицу? В документе есть одна простая...

0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
08.09.2022, 07:21
Помогаю со студенческими работами здесь

Python-docx Копирование таблиц в ворде
Здравствуйте. Уже месяц как осваиваю питон. Пишу свою программу, в которой будет функция экспорта данных в вордовский файл. Для выполнения...

Docx + python парсинг xml, не обновляются данные страниц, слов и символов
Добрый вечер, не могу решить следующую ситуацию. Создаю файл *.docx добавляю в него параграф в параграф пишу текст и сохраняю, если открыть...

Парсинг таблиц
Итак. Есть сайт. На нем много страниц. На некоторых страницах содержится одна или несколько таких таблиц, которые можно увидеть на рисунке....

Парсинг HTML таблиц
Внизу прикреплен рисунок HTML страницы. На рисунке видно, что HTML страница разбита на таблицы. Число таблиц может меняться, но никогда...

Парсинг электронных таблиц
Здравствуйте. Может кто подсказать какую-то унивеосальную библиотеку для парсинга электронных таблиц? JS не так давно учу, но есть опыт...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
1
Ответ Создать тему
Новые блоги и статьи
Символические и жёсткие ссылки в Linux.
algri14 15.03.2026
Существует два типа ссылок — символические и жёсткие. Ссылка в Linux — это дополнительная запись в каталоге, которая может указывать либо на inode «файла-ИСТОЧНИКА», тогда это будет «жёсткая. . .
[Owen Logic] Поддержание уровня воды в резервуаре количеством включённых насосов: моделирование и выбор регулятора
ФедосеевПавел 14.03.2026
Поддержание уровня воды в резервуаре количеством включённых насосов: моделирование и выбор регулятора ВВЕДЕНИЕ Выполняя задание на управление насосной группой заполнения резервуара,. . .
делаю науч статью по влиянию грибов на сукцессию
anaschu 13.03.2026
прикрепляю статью
SDL3 для Desktop (MinGW): Создаём пустое окно с нуля для 2D-графики на SDL3, Си и C++
8Observer8 10.03.2026
Содержание блога Финальные проекты на Си и на C++: hello-sdl3-c. zip hello-sdl3-cpp. zip Результат:
Установка CMake и MinGW 13.1 для сборки С и C++ приложений из консоли и из Qt Creator в EXE
8Observer8 10.03.2026
Содержание блога MinGW - это коллекция инструментов для сборки приложений в EXE. CMake - это система сборки приложений. Здесь описаны базовые шаги для старта программирования с помощью CMake и. . .
Как дизайн сайта влияет на конверсию: 7 решений, которые реально повышают заявки
Neotwalker 08.03.2026
Многие до сих пор воспринимают дизайн сайта как “красивую оболочку”. На практике всё иначе: дизайн напрямую влияет на то, оставит человек заявку или уйдёт через несколько секунд. Даже если у вас. . .
Модульная разработка через nuget packages
DevAlt 07.03.2026
Сложившийся в . Net-среде способ разработки чаще всего предполагает монорепозиторий в котором находятся все исходники. При создании нового решения, мы просто добавляем нужные проекты и имеем. . .
Модульный подход на примере F#
DevAlt 06.03.2026
В блоге дяди Боба наткнулся на такое определение: В этой книге («Подход, основанный на вариантах использования») Ивар утверждает, что архитектура программного обеспечения — это структуры,. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru