0 / 0 / 0
Регистрация: 09.10.2014
Сообщений: 4

Какими средствами осуществлять поиск в doc-файле?

09.10.2014, 13:46. Показов 4595. Ответов 9
Метки нет (Все метки)

Author24 — интернет-сервис помощи студентам
Добрый день. Необходимо производить поиск в файле doc. Какими средствами можно это осуществить?
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
09.10.2014, 13:46
Ответы с готовыми решениями:

Какими средствами написать конвертер DOC-HTML, HTML-DOC
Доброе время суток. Необходимо написать конвертер DOC-HTML, HTML-DOC. Как это сделать, ума не приложу. Есть идея использования регулярных...

В файле нужно осуществлять поиск
Вопрос по работе с файлами. А именно, имеется файл с данными (прайсы). В этом файле нужно осуществлять поиск (по коду товара). Файлик...

Осуществлять поиск в файле необходимых дат
Здравствуйте. Подскажите пожалуйста в создании следующей программы: "Необходимо написать программу, осуществляющую замену в текстовом...

9
 Аватар для Zuzik
298 / 256 / 57
Регистрация: 11.06.2012
Сообщений: 1,557
10.10.2014, 10:59
2 варианта - опен офис + питон - статья вот тут вроде http://habrahabr.ru/post/97637/ или более прямой способ с помощью библиотеки python-docx - https://python-docx.readthedocs.org/en/latest/
0
0 / 0 / 0
Регистрация: 09.10.2014
Сообщений: 4
10.10.2014, 16:19  [ТС]
Zuzik, Спасибо за 1-ю статью.
Вопрос о пакете Python-docx. Очень надеюсь что я столь невнимательна, но я кажется прочитала о этом пакете все,и кажется там только возможности генерирования доков, а редактирования существующих не нашла. Например у меня есть существующий шаблон, который я хочу редактировать. Не могли бы подсказать как с помощью этого пакета это осуществить?
спасибо!!
0
 Аватар для Zuzik
298 / 256 / 57
Регистрация: 11.06.2012
Сообщений: 1,557
10.10.2014, 17:30
Python
1
2
3
import docx
document = docx.Document(filename)
alltext = '\n\n'.join([paragraph.text.encode('utf-8') for paragraph in document.paragraphs])
вот пример кода выводящего весь документ. Вперед. Да, возможно придется поиграться с кодировками
да и как оказалоь эта библиотека поддерживает только докх файлы(
0
0 / 0 / 0
Регистрация: 09.10.2014
Сообщений: 4
10.10.2014, 17:58  [ТС]
Zuzik, спасибо побегу пробовать, надеюсь разберусь)
0
17 / 22 / 6
Регистрация: 16.10.2013
Сообщений: 316
14.10.2014, 17:04
лалала...ваш ответ) вопрос о doc а не docx
docx можно и xml распарсить и найти все что угодно...
как вариан с под винды юзаем офис апи, с под юникс - либреофис апи
0
 Аватар для Zuzik
298 / 256 / 57
Регистрация: 11.06.2012
Сообщений: 1,557
14.10.2014, 18:51
warrax, ну как бы я про это написал, если у вас проблемы со зрением.
Цитата Сообщение от Zuzik Посмотреть сообщение
да и как оказалоь эта библиотека поддерживает только докх файлы(
Добавлено через 40 минут
Хе, нашел полуработающую библиотеку которая читает док файлы, miette назвается. Правда она уже вроде как давным давно заброшена и не развивается.
1
17 / 22 / 6
Регистрация: 16.10.2013
Сообщений: 316
18.10.2014, 00:05
Цитата Сообщение от Zuzik Посмотреть сообщение
warrax, ну как бы я про это написал, если у вас проблемы со зрением.

Добавлено через 40 минут
Хе, нашел полуработающую библиотеку которая читает док файлы, miette назвается. Правда она уже вроде как давным давно заброшена и не развивается.
зачем полуработащее если можно юзать апи. либреофис вроде как норм справляется. Например обьединяет тучу док файлов в один с сохранением форматировки на ура
0
2741 / 2340 / 620
Регистрация: 19.03.2012
Сообщений: 8,830
18.10.2014, 15:13
Цитата Сообщение от warrax Посмотреть сообщение
зачем полуработащее если можно юзать апи
Ну да, таскать на все компы libreoffice в качестве зависимости, просто "замечательная идея".
Если как говорит Zuzik, библиотека работает не вижу причин её не использовать, а вообще если нужна "живая" библиотека, то это win32api (правда сразу можно забыть о кросс платформенности, но это другой вопрос).

P.S Кстати можно сохранить doc файл в виде html и тогда файл можно будет парсить lxml или другими библиотеками.
0
0 / 0 / 0
Регистрация: 09.10.2014
Сообщений: 4
20.10.2014, 22:41  [ТС]
спасибо всем кто ответил!!! в итоге правда открыла как xml и пропарсила)
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
20.10.2014, 22:41
Помогаю со студенческими работами здесь

Как в среде VISUAL C++ 2008 осуществлять поиск текста в файле WORD ?
Здравствуйте ! Подскажите, пожалуйста, как в среде VISUAL C++ 2008 осуществлять поиск текста в файле WORD ? Нужно найти строку в...

Поиск в тексте DOC-файлов последовательностей символов по шаблону и поиск найденных в TXT-файле (с логом)
Уважаемые программисты! Очень нужен bat-файл или скрипт, который решает такую задачу: 1. Осуществляет поиск в тексте массива...

Как вести поиск в локальном xml файле средствами ASP?
kakim obrazom mozhno vesti poisk v lokalnom xml file is asp page toest v xml file sohranaju zapros is database a zatem neobhodimo...

Какими средствами проще работать с БД в c++?
У меня есть проект, делал на C#, используя Entity Framework для работы с БД. Сейчас мне нужно его продублировать на консольный проект...

Какими средствами обращаться к серверу?
Делаю кроссплатформенный проект. Чем в Firemonkey можно заменить виндосовкий wininet? Ну или вообще какими средствами к серверу посоветуете...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
10
Ответ Создать тему
Опции темы

Новые блоги и статьи
Многопоточные приложения на C++
bytestream 14.05.2025
C++ всегда был языком, тесно работающим с железом, и потому особеннно эффективным для многопоточного программирования. Стандарт C++11 произвёл революцию, добавив в язык нативную поддержку потоков,. . .
Stack, Queue и Hashtable в C#
UnmanagedCoder 14.05.2025
Каждый опытный разработчик наверняка сталкивался с ситуацией, когда невинный на первый взгляд List<T> превращался в узкое горлышко всего приложения. Причина проста: универсальность – это прекрасно,. . .
Как использовать OAuth2 со Spring Security в Java
Javaican 14.05.2025
Протокол OAuth2 часто путают с механизмами аутентификации, хотя по сути это протокол авторизации. Представьте, что вместо передачи ключей от всего дома вашему другу, который пришёл полить цветы, вы. . .
Анализ текста на Python с NLTK и Spacy
AI_Generated 14.05.2025
NLTK, старожил в мире обработки естественного языка на Python, содержит богатейшую коллекцию алгоритмов и готовых моделей. Эта библиотека отлично подходит для образовательных целей и. . .
Реализация DI в PHP
Jason-Webb 13.05.2025
Когда я начинал писать свой первый крупный PHP-проект, моя архитектура напоминала запутаный клубок спагетти. Классы создавали другие классы внутри себя, зависимости жостко прописывались в коде, а о. . .
Обработка изображений в реальном времени на C# с OpenCV
stackOverflow 13.05.2025
Объединение библиотеки компьютерного зрения OpenCV с современным языком программирования C# создаёт симбиоз, который открывает доступ к впечатляющему набору возможностей. Ключевое преимущество этого. . .
POCO, ACE, Loki и другие продвинутые C++ библиотеки
NullReferenced 13.05.2025
В C++ разработки существует такое обилие библиотек, что порой кажется, будто ты заблудился в дремучем лесу. И среди этого многообразия POCO (Portable Components) – как маяк для тех, кто ищет. . .
Паттерны проектирования GoF на C#
UnmanagedCoder 13.05.2025
Вы наверняка сталкивались с ситуациями, когда код разрастается до неприличных размеров, а его поддержка становится настоящим испытанием. Именно в такие моменты на помощь приходят паттерны Gang of. . .
Создаем CLI приложение на Python с Prompt Toolkit
py-thonny 13.05.2025
Современные командные интерфейсы давно перестали быть черно-белыми текстовыми программами, которые многие помнят по старым операционным системам. CLI сегодня – это мощные, интуитивные и даже. . .
Конвейеры ETL с Apache Airflow и Python
AI_Generated 13.05.2025
ETL-конвейеры – это набор процессов, отвечающих за извлечение данных из различных источников (Extract), их преобразование в нужный формат (Transform) и загрузку в целевое хранилище (Load). . . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru