Форум программистов, компьютерный форум CyberForum.ru

C++

Войти
Регистрация
Восстановить пароль
 
Ieroglif
18 / 18 / 1
Регистрация: 23.06.2011
Сообщений: 237
#1

Парсинг файла / общие советы / проектирование - C++

14.04.2014, 13:46. Просмотров 372. Ответов 4
Метки нет (Все метки)

Здравствуйте, товарищи!

Необходимо "пропарсить" файл, имеющий расширение doc. Файл большой, более 32к страниц (акцентирую на этом внимание ввиду того, что MS World при таком кол-во страниц буянит и вылетает).

Есть ли возможность программно открыть файл для парсинга (да и вообще всяческой обработки) в блокноте, предварительно выбрав нужную кодировку?

Как наиболее адекватно и эффективно организовать парсинг файла (с максимальной скоростью и минимальными накладными растратами)? Может быть, у кого-нибудь есть дельные советы?
Similar
Эксперт
41792 / 34177 / 6122
Регистрация: 12.04.2006
Сообщений: 57,940
14.04.2014, 13:46
Здравствуйте! Я подобрал для вас темы с ответами на вопрос Парсинг файла / общие советы / проектирование (C++):

Парсинг большого текстового файла - C++ Builder
Приветствую! Вопрос вот в чем - Как открыть файл и прочесть содержимое разделив его на итемы. Пример кода на питоне. file =...

Парсинг полного имени файла - C++ Builder
создаю эмулятор командной строки в ДОС, который будет выполнять вводимые команды типа создания, копирования, редактирования, удаления...

Считывание и парсинг текста из файла - C++ Builder
Задание таково: У нас есть созданный файл где забита база от такого построчного формата(D-Date="02.05.2014...

Парсинг URL - получение имени файла - C++ Builder
Всем вечер добрый. Господа программисты, подскажите пожалуйста как мне из такого пути получить имя файла(который хочу загрузить) и...

Парсинг xml файла любой вложенности - C++ Builder
Здравствуйте! Необходимо распарсить xml документ и прочитать его свойства, построить дерево и на основе прочитанного документа создать...

Парсинг файла - C++
Загружаю файл в string, строка в файле только одна, так что масив ненужен. В чем задача стоит? Содержимое файла такое: {"параметр_1":...

Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
Smallvi
14.04.2014, 14:34
  #2

Не по теме:

Это у вас там "Война и мир" в 300-м шрифте?

gazlan
3131 / 1906 / 285
Регистрация: 27.08.2010
Сообщений: 5,132
Записей в блоге: 1
14.04.2014, 16:35 #3
Цитата Сообщение от Ieroglif Посмотреть сообщение
есть дельные советы?
Есть - забыть об этом.

Если вы не отличаете формат файла от расширения имени, вам рано еще этим заниматься.

Внутренности вордовских файлов: просто ужас
Ieroglif
18 / 18 / 1
Регистрация: 23.06.2011
Сообщений: 237
14.04.2014, 16:41  [ТС] #4
Нюансы я ещё успею изучить.

Тема парсинга всё ещё актуальна.
Izual
94 / 119 / 6
Регистрация: 13.11.2012
Сообщений: 1,551
14.04.2014, 23:20 #5
Ieroglif, а что именно вы не знаете?..
Открываете файл функцией fopen. Fgets - читаете строки.
Я использую примерно такую конструкцию:
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
while(!feof(fw))
            {
                fgets(textbuf, sizeof(textbuf), fw);
                fEFz++;//nlcy
            }
            if((fEFz != 1) || (strlen(textbuf) != 0))
            {
                if(fEx==0)
                    per=new baze[fEFz];
                else
                    preper=new baze[fEFz];
                fseek(fw, 0L, SEEK_SET);
                while(!feof(fw))
                {
                    fgets(textbuf, sizeof(textbuf), fw);
                    dl = strlen(textbuf);
Которую САМ нагуглил(ну и модифицировал под свои нужны), когда надо было изучить АЗЫ работы с файлами.
Первый шаг открытия и чтения файла допустим ты изучиш. Как кодировку менять не знаю, гугли или жди(пол года) - может кто скажет как =)
Синтаксис doc файла изучай потом. Открывай файл, читай(например первые 1000 строк) и перезаписывай в новый файл - это даст возможность открытия файлов меньшего размера в ворде (раз уж он ругается на размер изночального).
MoreAnswers
Эксперт
37091 / 29110 / 5898
Регистрация: 17.06.2006
Сообщений: 43,301
14.04.2014, 23:20
Привет! Вот еще темы с ответами:

Парсинг файла - C++
Вот открываю через FILE*, файл ввида "test" { "test1" "test1_1" "test2" "test2_1" "test3" "test3_1" ...

Парсинг строк из файла - C++
Имеется файл с содержанием 3 Text Text2 Text3

Парсинг файла .cnf - C++
Доброго времени суток, уважаемые форумчане. Помогите, пожалуйста, конкретным кодом к вот такой подзадаче: нужно прочитать .cnf файл -...

Парсинг файла игнорирует числа - C++
Всем добрый день. Пытаюсь прочитать данные из файла 3D модели в формате OBJ. bool L_ObjData::LoadFromFile(string FileName) { ...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
Yandex
Объявления
14.04.2014, 23:20
Ответ Создать тему
Опции темы

КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2017, vBulletin Solutions, Inc.
Рейтинг@Mail.ru