Форум программистов, компьютерный форум, киберфорум
Наши страницы
C++
Войти
Регистрация
Восстановить пароль
 
Ieroglif
19 / 19 / 2
Регистрация: 23.06.2011
Сообщений: 238
#1

Парсинг файла / общие советы / проектирование - C++

14.04.2014, 13:46. Просмотров 448. Ответов 4
Метки нет (Все метки)

Здравствуйте, товарищи!

Необходимо "пропарсить" файл, имеющий расширение doc. Файл большой, более 32к страниц (акцентирую на этом внимание ввиду того, что MS World при таком кол-во страниц буянит и вылетает).

Есть ли возможность программно открыть файл для парсинга (да и вообще всяческой обработки) в блокноте, предварительно выбрав нужную кодировку?

Как наиболее адекватно и эффективно организовать парсинг файла (с максимальной скоростью и минимальными накладными растратами)? Может быть, у кого-нибудь есть дельные советы?
http://www.cyberforum.ru/cpp/thread2272633.html
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
Similar
Эксперт
41792 / 34177 / 6122
Регистрация: 12.04.2006
Сообщений: 57,940
14.04.2014, 13:46
Я подобрал для вас темы с готовыми решениями и ответами на вопрос Парсинг файла / общие советы / проектирование (C++):

Парсинг .obj файла
при парсенге файла столкнулся с серьёзной проблемой, а именно у треугольника...

Парсинг большого текстового файла
Приветствую! Вопрос вот в чем - Как открыть файл и прочесть содержимое разделив...

Считывание и парсинг текста из файла
Задание таково: У нас есть созданный файл где забита база от такого...

Парсинг полного имени файла
создаю эмулятор командной строки в ДОС, который будет выполнять вводимые...

Парсинг URL - получение имени файла
Всем вечер добрый. Господа программисты, подскажите пожалуйста как мне из...

4
Smallvi
14.04.2014, 14:34
  #2

Не по теме:

Это у вас там "Война и мир" в 300-м шрифте?

0
gazlan
3139 / 1915 / 311
Регистрация: 27.08.2010
Сообщений: 5,132
Записей в блоге: 1
14.04.2014, 16:35 #3
Цитата Сообщение от Ieroglif Посмотреть сообщение
есть дельные советы?
Есть - забыть об этом.

Если вы не отличаете формат файла от расширения имени, вам рано еще этим заниматься.

Внутренности вордовских файлов: просто ужас
0
Ieroglif
19 / 19 / 2
Регистрация: 23.06.2011
Сообщений: 238
14.04.2014, 16:41  [ТС] #4
Нюансы я ещё успею изучить.

Тема парсинга всё ещё актуальна.
0
Izual
142 / 119 / 21
Регистрация: 13.11.2012
Сообщений: 1,564
14.04.2014, 23:20 #5
Ieroglif, а что именно вы не знаете?..
Открываете файл функцией fopen. Fgets - читаете строки.
Я использую примерно такую конструкцию:
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
while(!feof(fw))
            {
                fgets(textbuf, sizeof(textbuf), fw);
                fEFz++;//nlcy
            }
            if((fEFz != 1) || (strlen(textbuf) != 0))
            {
                if(fEx==0)
                    per=new baze[fEFz];
                else
                    preper=new baze[fEFz];
                fseek(fw, 0L, SEEK_SET);
                while(!feof(fw))
                {
                    fgets(textbuf, sizeof(textbuf), fw);
                    dl = strlen(textbuf);
Которую САМ нагуглил(ну и модифицировал под свои нужны), когда надо было изучить АЗЫ работы с файлами.
Первый шаг открытия и чтения файла допустим ты изучиш. Как кодировку менять не знаю, гугли или жди(пол года) - может кто скажет как =)
Синтаксис doc файла изучай потом. Открывай файл, читай(например первые 1000 строк) и перезаписывай в новый файл - это даст возможность открытия файлов меньшего размера в ворде (раз уж он ругается на размер изночального).
0
14.04.2014, 23:20
MoreAnswers
Эксперт
37091 / 29110 / 5898
Регистрация: 17.06.2006
Сообщений: 43,301
14.04.2014, 23:20
Привет! Вот еще темы с решениями:

Парсинг xml файла любой вложенности
Здравствуйте! Необходимо распарсить xml документ и прочитать его свойства,...

Игровой пк в районе 70к и общие советы
Доброго времени суток. Стал задумываться о новом пк. В данный момент у меня...

Проектирование радиопередатчиков. Литература, советы.
В качестве дополнительной работы к своей диссертации решил вот проработать...

[Проектирование БД] Автобаза - критика и советы
Задание: разработать веб-приложение. Предметная область: Диспетчер...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
5
Ответ Создать тему
Опции темы

КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2018, vBulletin Solutions, Inc.
Рейтинг@Mail.ru