Форум программистов, компьютерный форум, киберфорум
Python
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
 
Рейтинг 4.76/34: Рейтинг темы: голосов - 34, средняя оценка - 4.76
4 / 4 / 2
Регистрация: 07.05.2014
Сообщений: 489

Перенос текста из docx в txt

01.12.2016, 01:26. Показов 7776. Ответов 24
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Всем здравствуйте, как перенести текст в расширений docx в текстовый файл(txt)? На примере если можно. Заранее благодарю.
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
01.12.2016, 01:26
Ответы с готовыми решениями:

Как сделать перенос из отдного txt файла текста в другой txt файл в Turbo C?
Надо сделать с потоками. fopen fgets fputs - с этими функциями

Создание редактора текста, распознающего форматы txt, doc, docx
как сделать так чтобы чтобы проект текстовый редактор на visual studio express(Желательно 2010 или раньше) распознавал форматы txt,doc,docx...

Проблема различия кодировок txt и docx при переносе текста из одного файла в другой
При реализации конвертера из txt в docx, получаемый файл "повреждён", и ворд отказывается его открывать. Если же наоборот из docx в txt, то...

24
Эксперт по компьютерным сетям
 Аватар для Jabbson
5907 / 3359 / 1036
Регистрация: 03.11.2009
Сообщений: 10,008
01.12.2016, 03:11
Регулярные выражения
вот тут я показывал как получить текст из дока. Вы не знаете как сохранить этот текст в файл?
0
4 / 4 / 2
Регистрация: 07.05.2014
Сообщений: 489
01.12.2016, 18:14  [ТС]
Вот так правильно будет.
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
# -*- coding: utf-8 -*
import re
import string 
import sys
import docx
import re
 
def getText(filename):
    doc = docx.Document(filename)
    return '\n'.join([p.text for p in doc.paragraphs])
 
 
txt = getText('primer.docx')
myfile = open("text.txt", "w")
myfile.write(txt)
myfile.close()
Но возникла проблема с кодировкой.
0
4 / 4 / 2
Регистрация: 07.05.2014
Сообщений: 489
01.12.2016, 18:16  [ТС]
вот
Миниатюры
Перенос текста из docx в txt  
0
Эксперт Python
5438 / 3859 / 1215
Регистрация: 28.10.2013
Сообщений: 9,552
Записей в блоге: 1
01.12.2016, 19:20
Цитата Сообщение от Rodmistar Посмотреть сообщение
возникла проблема с кодировкой.
Попробуйте указать кодировку.
Python
1
open("test.txt", "w",encoding="utf-8")
0
4 / 4 / 2
Регистрация: 07.05.2014
Сообщений: 489
01.12.2016, 22:12  [ТС]
Попробовал, опять ошибка
Миниатюры
Перенос текста из docx в txt  
0
 Аватар для Luca Brasi
892 / 204 / 55
Регистрация: 06.11.2015
Сообщений: 2,288
Записей в блоге: 2
01.12.2016, 23:41
Rodmistar, через python3 запускать пробовали?
0
Эксперт Python
5438 / 3859 / 1215
Регистрация: 28.10.2013
Сообщений: 9,552
Записей в блоге: 1
01.12.2016, 23:43
Rodmistar,
И какой же python вы используете?
В 3.5 - этот параметр присутствует.
0
4 / 4 / 2
Регистрация: 07.05.2014
Сообщений: 489
02.12.2016, 00:33  [ТС]
нет. А стоит?

Добавлено через 4 минуты
А в чем разница будет?

Добавлено через 25 секунд
2.7
0
Эксперт Python
5438 / 3859 / 1215
Регистрация: 28.10.2013
Сообщений: 9,552
Записей в блоге: 1
02.12.2016, 01:28
Цитата Сообщение от Rodmistar Посмотреть сообщение
А в чем разница будет?
Вот это прочитайте.
Если вас все еще будет интересовать python 2.7, то велика вероятность того, что после нескольких лет изучения языка, вы обнаружите (внезапно), что ветка 2.x больше нигде не используется, кроме legacy code.
0
4 / 4 / 2
Регистрация: 07.05.2014
Сообщений: 489
02.12.2016, 09:34  [ТС]
Установил python 3, как правильно сделать, чтобы запускалось через командную строку, то есть python pros.py
0
 Аватар для Luca Brasi
892 / 204 / 55
Регистрация: 06.11.2015
Сообщений: 2,288
Записей в блоге: 2
02.12.2016, 11:37
Rodmistar, python3 pros.py
0
4 / 4 / 2
Регистрация: 07.05.2014
Сообщений: 489
02.12.2016, 12:27  [ТС]
Пишет что не является системным файлом

Добавлено через 45 минут
Вот как правильно установить python3. Правильная последовательность.
0
 Аватар для Luca Brasi
892 / 204 / 55
Регистрация: 06.11.2015
Сообщений: 2,288
Записей в блоге: 2
02.12.2016, 13:01
Rodmistar, ос какая?
В большинстве линукс дистрибутивов он из коробки есть
0
4 / 4 / 2
Регистрация: 07.05.2014
Сообщений: 489
02.12.2016, 13:12  [ТС]
Windows 8. Добавил в переменную среду путь к нему. а библиотека docx не работает для python3.

Добавлено через 8 минут
Я сейчас не пойму какую версию использую то ли 2.7 то ли 3
0
 Аватар для Luca Brasi
892 / 204 / 55
Регистрация: 06.11.2015
Сообщений: 2,288
Записей в блоге: 2
02.12.2016, 13:13
Тут я уже ограничен в идеях. Обычно под виндой ставят cygwin. Там уже предустановлен python3. Думаю такой вариант питона лишит вас проблем с кодировкой. Единственное, нужно будет отдельно установить библиотеку docx, тк её нет в стандартом наборе
0
Эксперт Python
5438 / 3859 / 1215
Регистрация: 28.10.2013
Сообщений: 9,552
Записей в блоге: 1
02.12.2016, 13:19
Цитата Сообщение от Rodmistar Посмотреть сообщение
библиотека docx не работает для python3
Работает. Просто раз у вас две версии python стоит (и путь к каждой есть в переменной PATH) - для каждой версии используйте свой pip для установки модулей.
Для python 2 - pip2, для python 3 - pip3.
Тоже самое с интерпретатором: python2 и python3.
А если хотите сделать, чтобы один интерпретатор был интерпретатором по умолчанию - то в списке PATH путь к нему должен находиться ближе к началу.
Он и будет запускаться по имени python.

У меня таким является python 3.5. Запускается просто как python.
PS: Переменными среды очень легко манипулировать через Rapid Environment Editor - программа с GUI, отображающая все ваши переменные среды.
0
Эксперт Python
5438 / 3859 / 1215
Регистрация: 28.10.2013
Сообщений: 9,552
Записей в блоге: 1
02.12.2016, 13:27
Тоже самое с интерпретатором: python2 и python3.
Ошибочка - только pip-ы есть с разными именами.

Добавлено через 1 минуту
А разные версии python можно только с указанием полного пути использовать.
Либо, как я писал выше - сделать одну из версий python - версией по умолчанию.
0
4 / 4 / 2
Регистрация: 07.05.2014
Сообщений: 489
02.12.2016, 13:32  [ТС]
1. Я устанавливаю в папку Python35-32 который он предлагает(на диск С)(там есть еще одна папка python27)
2. Захожу в систему и в переменные среды указываю новую переменную path значение C:\Python35-32.
Вроде все.
Далее захожу в cmd и переходу в корень папки где находится python35-32, и оттуда только можно запускать скрипт.

Добавлено через 3 минуты
Я хотел бы так: Захожу в папку где находится скрипт, оттуда запускаю cmd и прописываю python pars.py
0
757 / 306 / 190
Регистрация: 20.05.2016
Сообщений: 593
02.12.2016, 13:39
Цитата Сообщение от Garry Galler Посмотреть сообщение
А разные версии python можно только с указанием полного пути использовать.
а как же py (Python Launcher)?
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
02.12.2016, 13:39
Помогаю со студенческими работами здесь

Перенос текста с поля в txt
Сразу прошу прощения за вопрос по PHP в C#, но так и не нашёл PHP форум. Нужна ваша помощь абсолютно тёмному человеку...:wall: Как...

Перенос текста в формате Unicode из txt-файла в переменную
Как поместить в переменную VBA текст в формате Unicode из текстового файла? Конкретно, в моём случае - это нужно, чтобы осуществить поиск...

Из txt в docx
Пишу программу, которая помещает содержимое файла txt в документ Word 2007. Проблема в том, что в txt-файле кодировка ОЕМ, поэтому в Word...

Перенос .emf из .docx
Здравия желаю! Пользуюсь программой BPWin по учёбе и хотелось мне чуть подредактировать старые свои отчёты, находящиеся в .docx файле....

Преобразование документа *.txt в *.docx
Здравствуйте умные люди ;) Обработка документов MS Word. Как преобразовать документ *.txt в *.docx и задать его форматирование?


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
20
Ответ Создать тему
Новые блоги и статьи
Подстановка значения реквизита справочника в табличную часть документа
Maks 10.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "ПланированиеПерсонала", разработанного в конфигурации КА2. Задача: при выборе сотрудника (справочник Сотрудники) в ТЧ документа. . .
Очистка реквизитов документа при копировании
Maks 09.04.2026
Алгоритм из решения ниже применим как для типовых, так и для нетиповых документов на самых различных конфигурациях. Задача: при копировании документа очищать определенные реквизиты и табличную. . .
модель ЗдравоСохранения 8. Подготовка к разному выполнению заданий
anaschu 08.04.2026
https:/ / github. com/ shumilovas/ med2. git main ветка * содержимое блока дэлэй из старой модели теперь внутри зайца новой модели 8ATzM_2aurI
Блокировка документа от изменений, если он открыт у другого пользователя
Maks 08.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа, разработанного в конфигурации КА2. Задача: запретить редактирование документа, если он открыт у другого пользователя. / / . . .
Система безопасности+живучести для сервера-слоя интернета (сети). Двойная привязка.
Hrethgir 08.04.2026
Далее были размышления о системе безопасности. Сообщения с наклонным текстом - мои. А как нам будет можно проверить, что ссылка наша, а не подделана хулиганами, которая выбросит на другую ветку и. . .
Модель ЗдрввоСохранения 7: больше работников, больше ресурсов.
anaschu 08.04.2026
работников и заданий может быть сколько угодно, но настроено всё так, что используется пока что только 20% kYBz3eJf3jQ
Дальние перспективы сервера - слоя сети с космологическим дизайном интефейса карты и логики.
Hrethgir 07.04.2026
Дальнейшее ближайшее планирование вывело к размышлениям над дальними перспективами. И вот тут может быть даже будут нужны оценки специалистов, так как в дальних перспективах всё может очень сильно. . .
Горе от ума
kumehtar 07.04.2026
Эта мне ментальная установка, что вот прямо сейчас, мол, мне для полного счастья не хватает (нужное вписать), и когда я этого достигну - тогда и полный кайф. Одна из самых сильных ловушек на пути. . . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru