0 / 0 / 0
Регистрация: 09.10.2014
Сообщений: 4
1

Какими средствами осуществлять поиск в doc-файле?

09.10.2014, 13:46. Показов 4304. Ответов 9
Метки нет (Все метки)

Author24 — интернет-сервис помощи студентам
Добрый день. Необходимо производить поиск в файле doc. Какими средствами можно это осуществить?
0
Programming
Эксперт
94731 / 64177 / 26122
Регистрация: 12.04.2006
Сообщений: 116,782
09.10.2014, 13:46
Ответы с готовыми решениями:

Какими средствами написать конвертер DOC-HTML, HTML-DOC
Доброе время суток. Необходимо написать конвертер DOC-HTML, HTML-DOC. Как это сделать, ума не...

В файле нужно осуществлять поиск
Вопрос по работе с файлами. А именно, имеется файл с данными (прайсы). В этом файле нужно...

Осуществлять поиск в файле необходимых дат
Здравствуйте. Подскажите пожалуйста в создании следующей программы: "Необходимо написать...

Как в среде VISUAL C++ 2008 осуществлять поиск текста в файле WORD ?
Здравствуйте ! Подскажите, пожалуйста, как в среде VISUAL C++ 2008 осуществлять поиск текста в...

9
298 / 256 / 57
Регистрация: 11.06.2012
Сообщений: 1,557
10.10.2014, 10:59 2
2 варианта - опен офис + питон - статья вот тут вроде http://habrahabr.ru/post/97637/ или более прямой способ с помощью библиотеки python-docx - https://python-docx.readthedocs.org/en/latest/
0
0 / 0 / 0
Регистрация: 09.10.2014
Сообщений: 4
10.10.2014, 16:19  [ТС] 3
Zuzik, Спасибо за 1-ю статью.
Вопрос о пакете Python-docx. Очень надеюсь что я столь невнимательна, но я кажется прочитала о этом пакете все,и кажется там только возможности генерирования доков, а редактирования существующих не нашла. Например у меня есть существующий шаблон, который я хочу редактировать. Не могли бы подсказать как с помощью этого пакета это осуществить?
спасибо!!
0
298 / 256 / 57
Регистрация: 11.06.2012
Сообщений: 1,557
10.10.2014, 17:30 4
Python
1
2
3
import docx
document = docx.Document(filename)
alltext = '\n\n'.join([paragraph.text.encode('utf-8') for paragraph in document.paragraphs])
вот пример кода выводящего весь документ. Вперед. Да, возможно придется поиграться с кодировками
да и как оказалоь эта библиотека поддерживает только докх файлы(
0
0 / 0 / 0
Регистрация: 09.10.2014
Сообщений: 4
10.10.2014, 17:58  [ТС] 5
Zuzik, спасибо побегу пробовать, надеюсь разберусь)
0
17 / 22 / 6
Регистрация: 16.10.2013
Сообщений: 316
14.10.2014, 17:04 6
лалала...ваш ответ) вопрос о doc а не docx
docx можно и xml распарсить и найти все что угодно...
как вариан с под винды юзаем офис апи, с под юникс - либреофис апи
0
298 / 256 / 57
Регистрация: 11.06.2012
Сообщений: 1,557
14.10.2014, 18:51 7
warrax, ну как бы я про это написал, если у вас проблемы со зрением.
Цитата Сообщение от Zuzik Посмотреть сообщение
да и как оказалоь эта библиотека поддерживает только докх файлы(
Добавлено через 40 минут
Хе, нашел полуработающую библиотеку которая читает док файлы, miette назвается. Правда она уже вроде как давным давно заброшена и не развивается.
1
17 / 22 / 6
Регистрация: 16.10.2013
Сообщений: 316
18.10.2014, 00:05 8
Цитата Сообщение от Zuzik Посмотреть сообщение
warrax, ну как бы я про это написал, если у вас проблемы со зрением.

Добавлено через 40 минут
Хе, нашел полуработающую библиотеку которая читает док файлы, miette назвается. Правда она уже вроде как давным давно заброшена и не развивается.
зачем полуработащее если можно юзать апи. либреофис вроде как норм справляется. Например обьединяет тучу док файлов в один с сохранением форматировки на ура
0
2740 / 2339 / 620
Регистрация: 19.03.2012
Сообщений: 8,830
18.10.2014, 15:13 9
Цитата Сообщение от warrax Посмотреть сообщение
зачем полуработащее если можно юзать апи
Ну да, таскать на все компы libreoffice в качестве зависимости, просто "замечательная идея".
Если как говорит Zuzik, библиотека работает не вижу причин её не использовать, а вообще если нужна "живая" библиотека, то это win32api (правда сразу можно забыть о кросс платформенности, но это другой вопрос).

P.S Кстати можно сохранить doc файл в виде html и тогда файл можно будет парсить lxml или другими библиотеками.
0
0 / 0 / 0
Регистрация: 09.10.2014
Сообщений: 4
20.10.2014, 22:41  [ТС] 10
спасибо всем кто ответил!!! в итоге правда открыла как xml и пропарсила)
0
20.10.2014, 22:41
IT_Exp
Эксперт
87844 / 49110 / 22898
Регистрация: 17.06.2006
Сообщений: 92,604
20.10.2014, 22:41
Помогаю со студенческими работами здесь

Поиск в тексте DOC-файлов последовательностей символов по шаблону и поиск найденных в TXT-файле (с логом)
Уважаемые программисты! Очень нужен bat-файл или скрипт, который решает такую задачу: ...

Как вести поиск в локальном xml файле средствами ASP?
kakim obrazom mozhno vesti poisk v lokalnom xml file is asp page toest v xml file sohranaju...

Какими средствами проще работать с БД в c++?
У меня есть проект, делал на C#, используя Entity Framework для работы с БД. Сейчас мне нужно его...

Какими средствами обращаться к серверу?
Делаю кроссплатформенный проект. Чем в Firemonkey можно заменить виндосовкий wininet? Ну или вообще...

Какими средствами раскрутить сайт-визитку?
Здравствуйте, уважаемые форумчане! Ситуация такая: мой знакомый попросил меня сделать сайт-визитку...

Какими средствами создать справку к программе
В каком окне лучше создавать инструкцию по пользования в программе? Наподобие AboutBox для "О...

Какими средствами работать с сылками на сайтах
Подскажите какие использовать средства C# для написания ботов для браузерных игр. Допустим...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
10
Ответ Создать тему
Опции темы

КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2024, CyberForum.ru