Форум программистов, компьютерный форум, киберфорум
Python
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
0 / 0 / 0
Регистрация: 08.12.2015
Сообщений: 53

Парсинг docx таблиц с заголовком

08.09.2022, 07:21. Показов 4069. Ответов 0

Студворк — интернет-сервис помощи студентам
Здравствуйте, есть такой код:
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
from docx.api import Document
 
 
def parser(k):
    document = Document(1.docx)
    print(document)
    table = document.tables[k]
 
    #print(table)
 
    data = []
 
    keys = None
    for i, row in enumerate(table.rows):
        text = (cell.text for cell in row.cells)
 
       
        if i == 0:
            keys = tuple(text)
            continue
 
       
        row_data = dict(zip(text, text))
        data.append(row_data)
У меня много документов, в каждом по 3 таблицы, в таблицах 2 колонки и нет шапки.
Данный код парсит данные так как мне нужно, но не парсит первую строку, видимо предполагая, что это шапка. Помогите исправить...

Добавлено через 41 минуту
Разобрался, всего то навсего нужно было удалить условие...


Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
from docx.api import Document
 
 
def parser(k):
    document = Document(1.docx)
    print(document)
    table = document.tables[k]
 
    #print(table)
 
    data = []
 
    keys = None
    for i, row in enumerate(table.rows):
        text = (cell.text for cell in row.cells)
  
       
        row_data = dict(zip(text, text))
        data.append(row_data)
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
08.09.2022, 07:21
Ответы с готовыми решениями:

Парсинг Docx в PHP
Привет всем. Помогите пожалуйста. Задача в том, чтоб просмотреть текст залитого на сервер Docx файла и проверить его содержимое на...

Парсинг docx документа
Ситуация такая: есть парсер, который парсит docx библиотекой documentformat.openxml. Парсинг берёт все "раны" (теги в xml, в...

Парс таблиц из документа docx
Уже создавал тему, решением стала библиотека docx Щас не могу разобраться, как спарсить таблицу? В документе есть одна простая...

0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
08.09.2022, 07:21
Помогаю со студенческими работами здесь

Python-docx Копирование таблиц в ворде
Здравствуйте. Уже месяц как осваиваю питон. Пишу свою программу, в которой будет функция экспорта данных в вордовский файл. Для выполнения...

Docx + python парсинг xml, не обновляются данные страниц, слов и символов
Добрый вечер, не могу решить следующую ситуацию. Создаю файл *.docx добавляю в него параграф в параграф пишу текст и сохраняю, если открыть...

Парсинг таблиц
Итак. Есть сайт. На нем много страниц. На некоторых страницах содержится одна или несколько таких таблиц, которые можно увидеть на рисунке....

Парсинг HTML таблиц
Внизу прикреплен рисунок HTML страницы. На рисунке видно, что HTML страница разбита на таблицы. Число таблиц может меняться, но никогда...

Парсинг электронных таблиц
Здравствуйте. Может кто подсказать какую-то унивеосальную библиотеку для парсинга электронных таблиц? JS не так давно учу, но есть опыт...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
1
Ответ Создать тему
Новые блоги и статьи
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост.
Programma_Boinc 28.12.2025
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост. Налог на собак: https:/ / **********/ gallery/ V06K53e Финансовый отчет в Excel: https:/ / **********/ gallery/ bKBkQFf Пост отсюда. . .
Кто-нибудь знает, где можно бесплатно получить настольный компьютер или ноутбук? США.
Programma_Boinc 26.12.2025
Нашел на реддите интересную статью под названием Anyone know where to get a free Desktop or Laptop? Ниже её машинный перевод. После долгих разбирательств я наконец-то вернула себе. . .
Thinkpad X220 Tablet — это лучший бюджетный ноутбук для учёбы, точка.
Programma_Boinc 23.12.2025
Рецензия / Мнение/ Перевод Нашел на реддите интересную статью под названием The Thinkpad X220 Tablet is the best budget school laptop period . Ниже её машинный перевод. Thinkpad X220 Tablet —. . .
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта Симптом: После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
Как объединить две одинаковые БД Access с разными данными
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином. Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов. . . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru