Форум программистов, компьютерный форум CyberForum.ru

C++

Войти
Регистрация
Восстановить пароль
 
Ieroglif
18 / 18 / 1
Регистрация: 23.06.2011
Сообщений: 237
#1

Парсинг файла / общие советы / проектирование - C++

14.04.2014, 13:46. Просмотров 361. Ответов 4
Метки нет (Все метки)

Здравствуйте, товарищи!

Необходимо "пропарсить" файл, имеющий расширение doc. Файл большой, более 32к страниц (акцентирую на этом внимание ввиду того, что MS World при таком кол-во страниц буянит и вылетает).

Есть ли возможность программно открыть файл для парсинга (да и вообще всяческой обработки) в блокноте, предварительно выбрав нужную кодировку?

Как наиболее адекватно и эффективно организовать парсинг файла (с максимальной скоростью и минимальными накладными растратами)? Может быть, у кого-нибудь есть дельные советы?
Similar
Эксперт
41792 / 34177 / 6122
Регистрация: 12.04.2006
Сообщений: 57,940
14.04.2014, 13:46     Парсинг файла / общие советы / проектирование
Посмотрите здесь:

C++ Builder Парсинг полного имени файла
C++ Builder Парсинг URL - получение имени файла
C++ Парсинг файла игнорирует числа
C++ Парсинг строк из файла
Парсинг файла C++
C++ Парсинг файла
typdef struct + парсинг из файла C++
Парсинг из файла и суммирование столбца C++
C++ Парсинг файла .cnf
Считывание и парсинг текста из файла C++ Builder
C++ Парсинг текстового файла в map
Парсинг большого текстового файла C++ Builder

Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
После регистрации реклама в сообщениях будет скрыта и будут доступны все возможности форума.
Smallvi
14.04.2014, 14:34
  #2

Не по теме:

Это у вас там "Война и мир" в 300-м шрифте?

gazlan
3130 / 1905 / 285
Регистрация: 27.08.2010
Сообщений: 5,133
Записей в блоге: 1
14.04.2014, 16:35     Парсинг файла / общие советы / проектирование #3
Цитата Сообщение от Ieroglif Посмотреть сообщение
есть дельные советы?
Есть - забыть об этом.

Если вы не отличаете формат файла от расширения имени, вам рано еще этим заниматься.

Внутренности вордовских файлов: просто ужас
Ieroglif
18 / 18 / 1
Регистрация: 23.06.2011
Сообщений: 237
14.04.2014, 16:41  [ТС]     Парсинг файла / общие советы / проектирование #4
Нюансы я ещё успею изучить.

Тема парсинга всё ещё актуальна.
Izual
93 / 118 / 6
Регистрация: 13.11.2012
Сообщений: 1,537
14.04.2014, 23:20     Парсинг файла / общие советы / проектирование #5
Ieroglif, а что именно вы не знаете?..
Открываете файл функцией fopen. Fgets - читаете строки.
Я использую примерно такую конструкцию:
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
while(!feof(fw))
            {
                fgets(textbuf, sizeof(textbuf), fw);
                fEFz++;//nlcy
            }
            if((fEFz != 1) || (strlen(textbuf) != 0))
            {
                if(fEx==0)
                    per=new baze[fEFz];
                else
                    preper=new baze[fEFz];
                fseek(fw, 0L, SEEK_SET);
                while(!feof(fw))
                {
                    fgets(textbuf, sizeof(textbuf), fw);
                    dl = strlen(textbuf);
Которую САМ нагуглил(ну и модифицировал под свои нужны), когда надо было изучить АЗЫ работы с файлами.
Первый шаг открытия и чтения файла допустим ты изучиш. Как кодировку менять не знаю, гугли или жди(пол года) - может кто скажет как =)
Синтаксис doc файла изучай потом. Открывай файл, читай(например первые 1000 строк) и перезаписывай в новый файл - это даст возможность открытия файлов меньшего размера в ворде (раз уж он ругается на размер изночального).
Yandex
Объявления
14.04.2014, 23:20     Парсинг файла / общие советы / проектирование
Ответ Создать тему
Опции темы

Текущее время: 11:37. Часовой пояс GMT +3.
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2017, vBulletin Solutions, Inc.
Рейтинг@Mail.ru