Форум программистов, компьютерный форум, киберфорум
C++
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.60/5: Рейтинг темы: голосов - 5, средняя оценка - 4.60
 Аватар для Ieroglif
19 / 19 / 2
Регистрация: 23.06.2011
Сообщений: 238

Парсинг файла / общие советы / проектирование

14.04.2014, 13:46. Показов 957. Ответов 4
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Здравствуйте, товарищи!

Необходимо "пропарсить" файл, имеющий расширение doc. Файл большой, более 32к страниц (акцентирую на этом внимание ввиду того, что MS World при таком кол-во страниц буянит и вылетает).

Есть ли возможность программно открыть файл для парсинга (да и вообще всяческой обработки) в блокноте, предварительно выбрав нужную кодировку?

Как наиболее адекватно и эффективно организовать парсинг файла (с максимальной скоростью и минимальными накладными растратами)? Может быть, у кого-нибудь есть дельные советы?
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
14.04.2014, 13:46
Ответы с готовыми решениями:

Общие советы по продаже
Здравствуйте. Если ошибся с разделом, перенесите, пожалуйста. Я собрал себе новый комп, частично использовав комплектующие из...

Игровой пк в районе 70к и общие советы
Доброго времени суток. Стал задумываться о новом пк. В данный момент у меня такая машинка: fx-8350, r9 280x, 8gb RAM, бп на 600W. Хочется,...

[Проектирование БД] Автобаза - критика и советы
Задание: разработать веб-приложение. Предметная область: Диспетчер создает Рейсы, которые представлены в системе в виде списка,...

4
14.04.2014, 14:34

Не по теме:

Это у вас там "Война и мир" в 300-м шрифте?

0
3178 / 1937 / 312
Регистрация: 27.08.2010
Сообщений: 5,131
Записей в блоге: 1
14.04.2014, 16:35
Цитата Сообщение от Ieroglif Посмотреть сообщение
есть дельные советы?
Есть - забыть об этом.

Если вы не отличаете формат файла от расширения имени, вам рано еще этим заниматься.

Внутренности вордовских файлов: просто ужас
0
 Аватар для Ieroglif
19 / 19 / 2
Регистрация: 23.06.2011
Сообщений: 238
14.04.2014, 16:41  [ТС]
Нюансы я ещё успею изучить.

Тема парсинга всё ещё актуальна.
0
 Аватар для Izual
143 / 122 / 21
Регистрация: 13.11.2012
Сообщений: 1,564
14.04.2014, 23:20
Ieroglif, а что именно вы не знаете?..
Открываете файл функцией fopen. Fgets - читаете строки.
Я использую примерно такую конструкцию:
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
while(!feof(fw))
            {
                fgets(textbuf, sizeof(textbuf), fw);
                fEFz++;//nlcy
            }
            if((fEFz != 1) || (strlen(textbuf) != 0))
            {
                if(fEx==0)
                    per=new baze[fEFz];
                else
                    preper=new baze[fEFz];
                fseek(fw, 0L, SEEK_SET);
                while(!feof(fw))
                {
                    fgets(textbuf, sizeof(textbuf), fw);
                    dl = strlen(textbuf);
Которую САМ нагуглил(ну и модифицировал под свои нужны), когда надо было изучить АЗЫ работы с файлами.
Первый шаг открытия и чтения файла допустим ты изучиш. Как кодировку менять не знаю, гугли или жди(пол года) - может кто скажет как =)
Синтаксис doc файла изучай потом. Открывай файл, читай(например первые 1000 строк) и перезаписывай в новый файл - это даст возможность открытия файлов меньшего размера в ворде (раз уж он ругается на размер изночального).
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
14.04.2014, 23:20
Помогаю со студенческими работами здесь

Проектирование радиопередатчиков. Литература, советы.
В качестве дополнительной работы к своей диссертации решил вот проработать вопрос о передаче данных из грунта на поверхность. Доподлинно...

Парсинг XML файла и сохранение информации из файла в структуре или массиве
Доброго времени суток. Пытаюсь распарсить XML файл и вытащить оттуда все данные, а после записать их в структуру или массив. Файл парсится...

Как рассчитать средние общие издержки, общие издержки, доход, прибыл предприятия?
Фирма производит 10 единиц продукции. Средние постоянные издержки равны 25 у. е., средние переменные – 35 у. е. Цена единицы продукции – 70...

Парсинг файла
Вот открываю через FILE*, файл ввида "test" { "test1" "test1_1" "test2" "test2_1" "test3" "test3_1" ...

Парсинг файла
Привет всем! Создаю файл со списком изображений *.png (часть этого списка под спойлером) 01-01.png 01-02.png 01-03.png 01-04.png ...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
5
Ответ Создать тему
Новые блоги и статьи
Сумматор с применением элементов трёх состояний.
Hrethgir 26.03.2026
Тут. https:/ / fips. ru/ EGD/ ab3c85c8-836d-4866-871b-c2f0c5d77fbc Первый документ красиво выглядит, но без схемы. Это конечно не даёт никаких плюсов автору, но тем не менее. . . всё может быть. . .
Автозаполнение реквизитов при создании документа
Maks 26.03.2026
Код из решения ниже размещается в модуле объекта документа, в процедуре "ПриСозданииНаСервере". Алгоритм проверки заполнения реализован для исключения перезаписи значения реквизита, которое может. . .
Команды "Заполнить" и "Очистить" на форме документа
Maks 26.03.2026
1. Команда формы "ЗаполнитьЗапчасти". На примере нетипового документа разработанного в конфигурации КА2. В качестве источника данных указан регистр накопления, в который записываются данные о. . .
Кому нужен AOT?
DevAlt 26.03.2026
Решил сделать простой ланчер Написал заготовку: dotnet new console --aot -o UrlHandler var items = args. Split(":"); var tag = items; var id = items; var executable = args;. . .
Отправка уведомления на почту при изменении наименования справочника
Maks 24.03.2026
Программная отправка письма электронной почты на примере изменения наименования типового справочника "Склады" в конфигурации БП3. Перед реализацией необходимо выполнить настройку системной учетной. . .
модель ЗдравоСохранения 5. Меньше увольнений- больше дохода!
anaschu 24.03.2026
Теперь система здравосохранения уменьшает количество увольнений. 9TO2GP2bpX4 a42b81fb172ffc12ca589c7898261ccb/ https:/ / rutube. ru/ video/ a42b81fb172ffc12ca589c7898261ccb/ Слева синяя линия -. . .
Midnight Chicago Blues
kumehtar 24.03.2026
Такой Midnight Chicago Blues, знаешь?. . Когда вечерние улицы становятся ночными, а ты не можешь уснуть. Ты идёшь в любимый старый бар, и бармен наливает тебе виски. Ты смотришь на пролетающие. . .
SDL3 для Desktop (MinGW): Вывод текста со шрифтом TTF с помощью библиотеки SDL3_ttf на Си и C++
8Observer8 24.03.2026
Содержание блога Финальные проекты на Си и на C++: finish-text-sdl3-c. zip finish-text-sdl3-cpp. zip
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru