|
0 / 0 / 0
Регистрация: 10.07.2020
Сообщений: 1
|
|
Парсинг текстовых pdf файлов10.07.2020, 13:57. Показов 3654. Ответов 1
Всем доброго времени суток!
На днях получил задание - написать программу на c++, осуществляющую парсинг пдф файла, которая вытаскивает автора, название и краткую аннотацию из файла (который подразумевает под собой какую-нибудь статью) Начал гуглить и яндексить сразу и на всех языках) На наших форумах такие вопросы остаются без ответов.. (надеюсь не в этот раз!), на англоязычных форумах нужной информации тоже не нашёл. В общем, ни как парсить пдф, ни как парсить на с++ - так и не понял... Если вдруг кто-то поможет разобраться с заданием, объяснит, как можно парсить текстовые пдф-файлы на с++ - буду категорически признателен! (Если кто-то и с заданием поможет - с меня пивко)
0
|
|
| 10.07.2020, 13:57 | |
|
Ответы с готовыми решениями:
1
Защита текстовых файлов от копирования Считывание Кириллицы с текстовых файлов Регулярные выражения. Парсинг текстовых файлов |
|
19500 / 10105 / 2461
Регистрация: 30.01.2014
Сообщений: 17,818
|
|
| 11.07.2020, 18:47 | |
|
Zipri, если задача написать парсер с нуля, то вам нужно читать спецификацию на формат PDF, во всем там разобраться, а только потом писать код.
Вполне естественно, что решение такого задания останется без ответа, потому что мало кто захочет делать это бесплатно. Если же вам просто нужно прочитать какой-то pdf файл, без написания собственного парсера, то ваш вариант - найти готовую библиотеку для С или С++ и подключить ее в ваш проект на С++. Такая библиотека есть, называется PoDoFo.
0
|
|
| 11.07.2020, 18:47 | |
|
Помогаю со студенческими работами здесь
2
Чтение текстовых файлов Обработчик текстовых файлов Обработка текстовых файлов С использованием текстовых файлов Соединение 2 текстовых файлов Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
Очистка реквизитов документа при копировании
Maks 09.04.2026
Алгоритм из решения ниже применим как для типовых, так и для нетиповых документов на самых различных конфигурациях.
Задача: при копировании документа очищать определенные реквизиты и табличную. . .
|
модель ЗдравоСохранения 8. Подготовка к разному выполнению заданий
anaschu 08.04.2026
https:/ / github. com/ shumilovas/ med2. git
main ветка * содержимое блока дэлэй из старой модели теперь внутри зайца новой модели
8ATzM_2aurI
|
Блокировка документа от изменений, если он открыт у другого пользователя
Maks 08.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа, разработанного в конфигурации КА2.
Задача: запретить редактирование документа, если он открыт у другого пользователя.
/ / . . .
|
Система безопасности+живучести для сервера-слоя интернета (сети). Двойная привязка.
Hrethgir 08.04.2026
Далее были размышления о системе безопасности. Сообщения с наклонным текстом - мои.
А как нам будет можно проверить, что ссылка наша, а не подделана хулиганами, которая выбросит на другую ветку и. . .
|
|
Модель ЗдрввоСохранения 7: больше работников, больше ресурсов.
anaschu 08.04.2026
работников и заданий может быть сколько угодно, но настроено всё так, что используется пока что только 20%
kYBz3eJf3jQ
|
Дальние перспективы сервера - слоя сети с космологическим дизайном интефейса карты и логики.
Hrethgir 07.04.2026
Дальнейшее ближайшее планирование вывело к размышлениям над дальними перспективами. И вот тут может быть даже будут нужны оценки специалистов, так как в дальних перспективах всё может очень сильно. . .
|
Горе от ума
kumehtar 07.04.2026
Эта мне ментальная установка, что вот прямо сейчас, мол, мне для полного счастья не хватает (нужное вписать), и когда я этого достигну - тогда и полный кайф. Одна из самых сильных ловушек на пути. . . .
|
Использование значений реквизитов справочника в документе, с определенными условиями и правами
Maks 07.04.2026
1. Контроль срока действия договора
Алгоритм из решения ниже реализован на примере нетипового документа "ЗаявкаНаРаботу", разработанного в конфигурации КА2.
Задача: уведомлять пользователя, если. . .
|