Форум программистов, компьютерный форум, киберфорум
Наши страницы

С++ для начинающих

Войти
Регистрация
Восстановить пароль
 
Ezekiel
0 / 0 / 0
Регистрация: 04.06.2016
#1

Поиск в файлах с различными форматами - C++

30.06.2012, 04:25. Просмотров 318. Ответов 1
Метки нет (Все метки)

Добрый день, собственно появилась задача - в винде открывать файлы различных форматов и затем производить писк по ключевым словам в теле файла.
Так как необходимо работать с весьма различными по свое структуре форматами (.djvu,.pdf, файлы офиса от MS) возникают вопросы следующие:
1) Каким образом лучше определять форматы файла? Т.е. я понимаю, что необходимо открывать на бинарное чтение файлы, считывать определенное количество инфы, анализировать ее (например сравнивать с уже имеющимися масками заголовков для распространенных файлов) тем самым определяя формат. Но нет ли уже готового решения, например библиотеки какой под эти нужды? или лучше поковыряться в линуксовом file?
2) Опять таки, писать классы с нуля для работы под каждый формат - желание отсутствует. Есть ли какая-нить библиотека по работе с большим количеством, скажем так текстовых форматов, или все таки придется искать примочки для работы с каждым отдельным форматом?
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
Similar
Эксперт
41792 / 34177 / 6122
Регистрация: 12.04.2006
Сообщений: 57,940
30.06.2012, 04:25
Здравствуйте! Я подобрал для вас темы с ответами на вопрос Поиск в файлах с различными форматами (C++):

Поиск слов в файлах - C++
Здравствуйте, у меня такая задача: в нескольких файлах (объем в совокупности от 10 до 15 гб) надо найти примерно 1000-1500 "слов"...

Поиск одинаковых слов в текстовых файлах - C++
помогите пожалуйста...C++ написать прогу которая 2 txt файла сравнивает на одинаковые слова и выводит их в qlistwidget или хотябы в 3...

Класс строк с различными функциями - C++
Добрый вечер! Облазила весь форум, но нужной информации так и не нашла для себя) В общем, вот в чем вся соль: Нужно написать класс строк...

Подсчет строк с различными элементами - C++
Написал программу, но она не считает что нужно( Найти количество строк матрицы MxN, в которых все элементы различны. #include...

Шаблон принимает аргументы с различными типами - C++
template <class T> T function(T a,T b) { if(a>b)return a; else return b; } Если я делаю вызов с различными типами...

Решение систем линейных уравнений различными методами - C++
#include "stdafx.h" #include "iostream" #include "cmath" using namespace std; void input(float**A,float*B,float**C,float**R,int...

1
MrGluck
Модератор
Эксперт CЭксперт С++
7497 / 4613 / 694
Регистрация: 29.11.2010
Сообщений: 12,631
30.06.2012, 05:05 #2
Для определения формата думаю можно будет использовать это: http://www.boost.org/doc/libs/1_33_1...onvenience.htm
Для работы с текстом бери http://www.boost.org/doc/libs/1_50_0/libs/regex/doc/html/index.html
0
MoreAnswers
Эксперт
37091 / 29110 / 5898
Регистрация: 17.06.2006
Сообщений: 43,301
30.06.2012, 05:05
Привет! Вот еще темы с ответами:

Заполнить матрицу различными числами и вывести на экран - C++
Добрый вечер. Помогите с задачей: Создать матрицу требуемого размера. Заполнить её различными числами и вывести на экран. Времени в...

Определить являются ли все цифры числа различными - C++
Нужно Написать программу :С клавиатуры вводиться десятизначное число, если хоть одна цифра в этом числе повторяется, то вывести слово...

Запутались с синтаксисом вызова метода различными способами - C++
Помогите пожалуйста! Сегодня в университете был тест, где нужно вписать кое-какой код, чтобы получить очки за правильный ответ. Проблема в...

Разработать программу «Численное интегрирование» различными методами в С++ - C++
Помогите Разработать программу «Численное интегрирование» различными методами: 1) по формуле Ньютона-Котеса; 2) по формуле Симпсона; ...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
2
Ответ Создать тему
Опции темы

КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2017, vBulletin Solutions, Inc.