Форум программистов, компьютерный форум, киберфорум
С++ для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.67/3: Рейтинг темы: голосов - 3, средняя оценка - 4.67
ezekiel

Поиск в файлах с различными форматами

30.06.2012, 04:25. Показов 605. Ответов 1
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Добрый день, собственно появилась задача - в винде открывать файлы различных форматов и затем производить писк по ключевым словам в теле файла.
Так как необходимо работать с весьма различными по свое структуре форматами (.djvu,.pdf, файлы офиса от MS) возникают вопросы следующие:
1) Каким образом лучше определять форматы файла? Т.е. я понимаю, что необходимо открывать на бинарное чтение файлы, считывать определенное количество инфы, анализировать ее (например сравнивать с уже имеющимися масками заголовков для распространенных файлов) тем самым определяя формат. Но нет ли уже готового решения, например библиотеки какой под эти нужды? или лучше поковыряться в линуксовом file?
2) Опять таки, писать классы с нуля для работы под каждый формат - желание отсутствует. Есть ли какая-нить библиотека по работе с большим количеством, скажем так текстовых форматов, или все таки придется искать примочки для работы с каждым отдельным форматом?
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
30.06.2012, 04:25
Ответы с готовыми решениями:

Поиск в текстовых файлах символьных групп по шаблону и последующий поиск найденных в именах файлов (с логом)
Господа программисты! Прошу помочь в таком вопросе! Исходные данные: Последовательности такого вида: где ???? - это...

Поиск в файлах
есть несколько .txt файлов, в них текст; есть ПОИСК - textBox1, button1; есть tabControl1 с несколькими tabPage, в которых много...

Поиск в файлах
Добрый день. Хочу спросить у вас, в каких расширениях документов, реально сделать поиск на сайте. Так что бы индексировалось все внутри...

1
Форумчанин
Эксперт CЭксперт С++
 Аватар для MrGluck
8216 / 5047 / 1437
Регистрация: 29.11.2010
Сообщений: 13,453
30.06.2012, 05:05
Для определения формата думаю можно будет использовать это: http://www.boost.org/doc/libs/... nience.htm
Для работы с текстом бери http://www.boost.org/doc/libs/... index.html
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
30.06.2012, 05:05
Помогаю со студенческими работами здесь

Поиск в .mht файлах
Существует ли способ поиска .mht файлов по словам содержащегося в них текста, т. е. аналог поиска Windows по слову или фразе в файле?...

Поиск синонимов в файлах
Даны 2 текстовых файла (f1.txt и f2.txt). В первом есть текст, к примеру "Сегодня я сел на быстрый поезд. Мои глаза сильно устали после...

Поиск .exe в файлах
Здравствуйте! У меня такой вопрос.. Есть файл , формат может быть любой , exe , dll , jpg всё что угодно вообщем. Если его открыть через...

Поиск строк в файлах
Надо найти все файлы *.texture.txt в указанной папке и найти эти файлы. В этих файлах надо искать в файлах строку alpha=%имя файла%.jpg и...

Поиск текста в файлах
Необходимо по кнопке выбрать директорию поиска, в textbox ввести текст, который нужно найти в файлах, найденные документы помещать в...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
2
Ответ Создать тему
Новые блоги и статьи
SDL3 для Desktop (MinGW): Создаём пустое окно с нуля для 2D-графики на SDL3, Си и C++
8Observer8 10.03.2026
Содержание блога Финальные проекты на Си и на C++: hello-sdl3-c. zip hello-sdl3-cpp. zip Результат:
Установка CMake и MinGW 13.1 для сборки С и C++ приложений из консоли и из Qt Creator в EXE
8Observer8 10.03.2026
Содержание блога MinGW - это коллекция инструментов для сборки приложений в EXE. CMake - это система сборки приложений. Здесь описаны базовые шаги для старта программирования с помощью CMake и. . .
Как дизайн сайта влияет на конверсию: 7 решений, которые реально повышают заявки
Neotwalker 08.03.2026
Многие до сих пор воспринимают дизайн сайта как “красивую оболочку”. На практике всё иначе: дизайн напрямую влияет на то, оставит человек заявку или уйдёт через несколько секунд. Даже если у вас. . .
Модульная разработка через nuget packages
DevAlt 07.03.2026
Сложившийся в . Net-среде способ разработки чаще всего предполагает монорепозиторий в котором находятся все исходники. При создании нового решения, мы просто добавляем нужные проекты и имеем. . .
Модульный подход на примере F#
DevAlt 06.03.2026
В блоге дяди Боба наткнулся на такое определение: В этой книге («Подход, основанный на вариантах использования») Ивар утверждает, что архитектура программного обеспечения — это структуры,. . .
Управление камерой с помощью скрипта OrbitControls.js на Three.js: Вращение, зум и панорамирование
8Observer8 05.03.2026
Содержание блога Финальная демка в браузере работает на Desktop и мобильных браузерах. Итоговый код: orbit-controls-threejs-js. zip. Сканируйте QR-код на мобильном. Вращайте камеру одним пальцем,. . .
SDL3 для Web (WebAssembly): Синхронизация спрайтов SDL3 и тел Box2D
8Observer8 04.03.2026
Содержание блога Финальная демка в браузере. Итоговый код: finish-sync-physics-sprites-sdl3-c. zip На первой гифке отладочные линии отключены, а на второй включены:. . .
SDL3 для Web (WebAssembly): Идентификация объектов на Box2D v3 - использование userData и событий коллизий
8Observer8 02.03.2026
Содержание блога Финальная демка в браузере. Итоговый код: finish-collision-events-sdl3-c. zip Сканируйте QR-код на мобильном и вы увидите, что появится джойстик для управления главным героем. . . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru