Форум программистов, компьютерный форум, киберфорум
Python для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.89/18: Рейтинг темы: голосов - 18, средняя оценка - 4.89
0 / 0 / 0
Регистрация: 06.09.2018
Сообщений: 24

Пропуск чтения пустого файла docx (и вывод полного содержимого файла)

06.11.2018, 17:52. Показов 3631. Ответов 7
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Добрый день!
Данный кусок кода при чтении пустого файла docx выдает ошибку – «…"Package not found at '%s'" % pkg_file
docx.opc.exceptions.PackageNotFoundError : Package not found at 'document.docx'».
Не могу разобраться, как доработать указанный код для пропуска пустых файлов docx (или для вывода на экран, например, «пустой файл»). Используется модуль python-docx.
И еще из файлов не выводится содержимое объектов «надпись» и колонтитулов (выводятся строки и содержимое таблиц).

В идеале хотелось бы производить полное считывание содержимого файла.

Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
import docx.document
import docx.oxml.table
import docx.oxml.text.paragraph
import docx.table
import docx.text.paragraph
import sys
import os
from sys import stdin, stdout
from os import path
import logging
from docx import Document
 
document = Document('document.docx') 
 
def iter_paragraphs(parent, recursive=True):
    """
    Yield each paragraph and table child within *parent*, in document order.
    Each returned value is an instance of Paragraph. *parent*
    would most commonly be a reference to a main Document object, but
    also works for a _Cell object, which itself can contain paragraphs and tables.
    """
    if isinstance(parent, docx.document.Document):
        parent_elm = parent.element.body
    elif isinstance(parent, docx.table._Cell):
        parent_elm = parent._tc
    else:
        raise TypeError(repr(type(parent)))
 
    for child in parent_elm.iterchildren():
        if isinstance(child, docx.oxml.text.paragraph.CT_P):
            yield docx.text.paragraph.Paragraph(child, parent)
        elif isinstance(child, docx.oxml.table.CT_Tbl):
            if recursive:
                table = docx.table.Table(child, parent)
                for row in table.rows:
                    for cell in row.cells:
                        for child_paragraph in iter_paragraphs(cell):
                            yield child_paragraph
 
 
for paragraph in iter_paragraphs(document):
    print(paragraph.text)
Спасибо!
Миниатюры
Пропуск чтения пустого файла docx (и вывод полного содержимого файла)  
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
06.11.2018, 17:52
Ответы с готовыми решениями:

Открытие файла для чтения и вывод его содержимого на экран
Вообще задача звучит так: Файл содержит сведения о товарах, находящихся на складе: наименование, объем партии, дата поступления на склад,...

Ошибки содержимого файла docx при скачивании файла
Здравствуйте. По не зависящим от меня причинам, пришлось перейти на версию PHP 5.6, и соответственно на Apache 2.4 (до этого был...

Пропуск чтения файла
В точке остановы пропускает while (46 строка), не понимаю почему если честно. И пожалуйста без негатива, я плох в теме файлов. (и в плюсах)...

7
Эксперт Python
5438 / 3859 / 1215
Регистрация: 28.10.2013
Сообщений: 9,552
Записей в блоге: 1
06.11.2018, 18:44
Цитата Сообщение от Sador01 Посмотреть сообщение
при чтении пустого файла docx
Файл docx, который вы создаете из контекстного меню не является пустым файлом docx - он является просто пустым файлом. Такие файлы python-docx не читает, потому что там нет никакой xml структуры и это не zip.
Зачем вы такие файлы пытаетесь читать?

По сабжу: перехватывайте docx.opc.exceptions.PackageNotFoundError .
1
0 / 0 / 0
Регистрация: 06.09.2018
Сообщений: 24
07.11.2018, 10:51  [ТС]
Этот кусок кода входит в программу, которая ищет файлы docx в указанной папке (и вложенных папках) на компьютерах пользователей, открывает их и выполняет поиск по содержимому. Но иногда пользователи создают (случайно или нет) пустые файлы и не удаляют потом. Вот на таких файлах программа спотыкается. Также не считывается содержимое (как я ранее написал) объектов «надпись» и колонтитулов. В принципе модуль python-docx позволяет читать такие вещи?
Спасибо.
0
Эксперт Python
5438 / 3859 / 1215
Регистрация: 28.10.2013
Сообщений: 9,552
Записей в блоге: 1
07.11.2018, 11:32
Цитата Сообщение от Sador01 Посмотреть сообщение
не считывается содержимое (как я ранее написал) объектов «надпись» и колонтитулов
Судя по тишине на эту тему - как не поддерживалась работа с колонтитулами 3 года назад, так и не поддерживается до сих пор. Что такое "надпись" понятия не имею.
0
0 / 0 / 0
Регистрация: 06.09.2018
Сообщений: 24
07.11.2018, 15:48  [ТС]
Объект «надпись» - это картинка, которую я прикрепил к первому сообщению, часто используется при составлении писем.

Добавлено через 2 минуты
Есть еще какие-нибудь способы чтения docx-файлов помимо модуля python-docx?
0
Эксперт Python
5438 / 3859 / 1215
Регистрация: 28.10.2013
Сообщений: 9,552
Записей в блоге: 1
07.11.2018, 15:53
Цитата Сообщение от Sador01 Посмотреть сообщение
Есть еще какие-нибудь способы чтения docx-файлов
Ну, конечно :-) MS OFFICE WORD - он умеет делать все.
0
0 / 0 / 0
Регистрация: 06.09.2018
Сообщений: 24
07.11.2018, 15:55  [ТС]
:-)
0
Эксперт Python
5438 / 3859 / 1215
Регистрация: 28.10.2013
Сообщений: 9,552
Записей в блоге: 1
07.11.2018, 16:14
Зря смеетесь. Я серьезно. Интерфейс COM объекта Word.Application имеет весь набор необходимых методов для работы с docx.
Ни одна сторонняя библиотека даже близко их не реализует. Для работы с COM объектами нужна python либа pywin32.
Примеры работы с Word через Word.Application и pywin32 легко гуглятся. Даже на этом форуме.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
07.11.2018, 16:14
Помогаю со студенческими работами здесь

IdHTTP для чтения содержимого файла
Использую компоненту IdHTTP для чтения содержимого файла на сервере, проблема возникает если у пользователя подключение к Интернету через...

Как правильно осуществить прочтение и вывод из файла .docx?
С помощью текстового редактора определите, сколько раз, не считая сносок, встречается слово «свет» или «Свет» в тексте романа в стихах А....

Вывод полного имени файла, открытого в Opendialog, через edit
Добрый день) Пожалуйста помогите, сутки над этой проблемой сижу. Хочу вывести полное имя файла выборного через Opendialog, вывод...

Вывод в текстовый файл полного пути и размера каждого файла
Приветствую! Помогите написать батник. Закинул его в директорию, запустил, а он вывел в текстовый файл полный путь каждого файла и...

Считывание информации из файла docx и запись в созданный файл docx
Нужно сделать консольное приложение для считывания информации с docx и запись в созданные файл docx


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
8
Ответ Создать тему
Новые блоги и статьи
SDL3 для Web (WebAssembly): Обработчик клика мыши в браузере ПК и касания экрана в браузере на мобильном устройстве
8Observer8 02.02.2026
Содержание блога Для начала пошагово создадим рабочий пример для подготовки к экспериментам в браузере ПК и в браузере мобильного устройства. Потом напишем обработчик клика мыши и обработчик. . .
Философия технологии
iceja 01.02.2026
На мой взгляд у человека в технических проектах остается роль генерального директора. Все остальное нейронки делают уже лучше человека. Они не могут нести предпринимательские риски, не могут. . .
SDL3 для Web (WebAssembly): Вывод текста со шрифтом TTF с помощью SDL3_ttf
8Observer8 01.02.2026
Содержание блога В этой пошаговой инструкции создадим с нуля веб-приложение, которое выводит текст в окне браузера. Запустим на Android на локальном сервере. Загрузим Release на бесплатный. . .
SDL3 для Web (WebAssembly): Сборка C/C++ проекта из консоли
8Observer8 30.01.2026
Содержание блога Если вы откроете примеры для начинающих на официальном репозитории SDL3 в папке: examples, то вы увидите, что все примеры используют следующие четыре обязательные функции, а. . .
SDL3 для Web (WebAssembly): Установка Emscripten SDK (emsdk) и CMake для сборки C и C++ приложений в Wasm
8Observer8 30.01.2026
Содержание блога Для того чтобы скачать Emscripten SDK (emsdk) необходимо сначало скачать и уставить Git: Install for Windows. Следуйте стандартной процедуре установки Git через установщик. . . .
SDL3 для Android: Подключение Box2D v3, физика и отрисовка коллайдеров
8Observer8 29.01.2026
Содержание блога Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами. Версия v3 была полностью переписана на Си, в. . .
Инструменты COM: Сохранение данный из VARIANT в файл и загрузка из файла в VARIANT
bedvit 28.01.2026
Сохранение базовых типов COM и массивов (одномерных или двухмерных) любой вложенности (деревья) в файл, с возможностью выбора алгоритмов сжатия и шифрования. Часть библиотеки BedvitCOM Использованы. . .
SDL3 для Android: Загрузка PNG с альфа-каналом с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 28.01.2026
Содержание блога SDL3 имеет собственные средства для загрузки и отображения PNG-файлов с альфа-каналом и базовой работы с ними. В этой инструкции используется функция SDL_LoadPNG(), которая. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru