С Новым годом! Форум программистов, компьютерный форум, киберфорум
Python: Django
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.73/30: Рейтинг темы: голосов - 30, средняя оценка - 4.73
0 / 0 / 0
Регистрация: 15.12.2018
Сообщений: 1

Обработка полученного docx-файла

15.12.2018, 23:12. Показов 5841. Ответов 2
Метки docx, go, web (Все метки)

Студворк — интернет-сервис помощи студентам
Всем доброго время суток, хотел спросить, в форме получаю docx-файл, его содержимое необходимо прочитать и записать в БД. Обработку docx собираюсь производить через python-docx, на вход ему надо дать файл в таком типе данных:
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
f = open('foobar.docx', 'rb')
document = Document(f)
f.close()
 
# or
 
with open('foobar.docx', 'rb') as f:
    source_stream = StringIO(f.read())
document = Document(source_stream)
source_stream.close()
...
target_stream = StringIO()
document.save(target_stream)
собственно сам вопрос как из
Python
1
request.FILES['file']
достать сам файл чтобы его можно было обработать? (вижу еще вариант: это сохранить его в файловой системе, открыть как файл и уже обрабатывать, но меня не устраивает сохранение, ведь он и так "загружен" либо в память, либо во временном хранилище)
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
15.12.2018, 23:12
Ответы с готовыми решениями:

Считывание информации из файла docx и запись в созданный файл docx
Нужно сделать консольное приложение для считывания информации с docx и запись в созданные файл docx

Создание/склеивание doc\docx файла из шаблона doc\docx с заменой ключевых слов
Подскажите, как можно такое реализовать? Я узнал, что в rtf нельзя делать разрыв страницы, а просто как с текстовым файлом с doc и docx...

Обработка звука полученного от модема
Привет! Я так и не понял куда мне написать это сообщение, попробую сюда. Суть такая: есть модем USB Huaweii E173. После приёма вызова и...

2
Эксперт Python
5438 / 3859 / 1215
Регистрация: 28.10.2013
Сообщений: 9,552
Записей в блоге: 1
16.12.2018, 00:03
Могу ошибаться, но объект типа UploadedFile, который содержится в request.FILES['file'] имеет методы для считывания:

UploadedFile.read()
Read the entire uploaded data from the file. Be careful with this method: if the uploaded file is huge it can overwhelm your system if you try to read it into memory. You’ll probably want to use chunks() instead; see below.

UploadedFile.chunks(chunk_size=None)
Отсюда простая логика: передайте в BytesIO(request.FILES['file'].read()). Либо считывайте чанками в тот же самый BytesIO.
BytesIO нужен потому, что .read() прочитает данные как байты.
0
 Аватар для TimeTwo
102 / 95 / 104
Регистрация: 29.11.2009
Сообщений: 407
17.12.2018, 09:51
во первых для чтения docx, воспользуйтесь специальной библиотекой: python-docx
во вторых можно передать его как есть, python откроет, например:

Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
from django.shortcuts import render
from .forms import FileUpload
from docx import Document
 
 
def file_upload(request):
    form = FileUpload(request.POST or None, request.FILES or None)
    if request.method == 'POST' and form.is_valid():
        upload_file_snipet(request.FILES['file_name_from_form'])
    content = {'form': form}
    return render(request, 'my_app/file_upload.html', content)
 
 
def upload_file_snipet(file):
    document = Document(file)
    # do anything you want 
    # now if you want to save it we need
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
17.12.2018, 09:51
Помогаю со студенческими работами здесь

Обработка массива, полученного из api vk
Все сделал верно: авторизовался, получил токен, и на экране вывел ссылку (если её вставить в адресную строку браузера - выдаст инф о...

Обработка json полученного от vkapi
Есть список постов в json. Нужно вытащить только текст из всех постов, делаю это так prof = api.wall.get(owner_id=data) ...

Обработка полученного сообщения в почтовом клиенте
Возникла проблема, при обработке сообщения, которое я получаю с почты в формате MIME с помощью протокола POP3. А точнее, я не могу понять,...

Обработка полученного сигнала и отображение нового
Добрый день. Прошу помочь с преобразованием сигнала. Принимаю пилообразный сигнал, у которого максимумы пил уменьшаются и...

Пропуск чтения пустого файла docx (и вывод полного содержимого файла)
Добрый день! Данный кусок кода при чтении пустого файла docx выдает ошибку – «…"Package not found at '%s'" % pkg_file ...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
3
Ответ Создать тему
Новые блоги и статьи
Модель микоризы: классовый агентный подход
anaschu 02.01.2026
Раньше это было два гриба и бактерия. Теперь три гриба, растение. И на уровне агентов добавится между грибами или бактериями взаимодействий. До того я пробовал подход через многомерные массивы,. . .
Учёным и волонтёрам проекта «Einstein@home» удалось обнаружить четыре гамма-лучевых пульсара в джете Млечного Пути
Programma_Boinc 01.01.2026
Учёным и волонтёрам проекта «Einstein@home» удалось обнаружить четыре гамма-лучевых пульсара в джете Млечного Пути Сочетание глобально распределённой вычислительной мощности и инновационных. . .
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост.
Programma_Boinc 28.12.2025
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост. Налог на собак: https:/ / **********/ gallery/ V06K53e Финансовый отчет в Excel: https:/ / **********/ gallery/ bKBkQFf Пост отсюда. . .
Кто-нибудь знает, где можно бесплатно получить настольный компьютер или ноутбук? США.
Programma_Boinc 26.12.2025
Нашел на реддите интересную статью под названием Anyone know where to get a free Desktop or Laptop? Ниже её машинный перевод. После долгих разбирательств я наконец-то вернула себе. . .
Thinkpad X220 Tablet — это лучший бюджетный ноутбук для учёбы, точка.
Programma_Boinc 23.12.2025
Рецензия / Мнение/ Перевод Нашел на реддите интересную статью под названием The Thinkpad X220 Tablet is the best budget school laptop period . Ниже её машинный перевод. Thinkpad X220 Tablet —. . .
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта Симптом: После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
Как объединить две одинаковые БД Access с разными данными
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru