Форум программистов, компьютерный форум, киберфорум
C++
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.67/18: Рейтинг темы: голосов - 18, средняя оценка - 4.67
0 / 0 / 0
Регистрация: 10.07.2020
Сообщений: 1

Парсинг текстовых pdf файлов

10.07.2020, 13:57. Показов 3654. Ответов 1

Студворк — интернет-сервис помощи студентам
Всем доброго времени суток!

На днях получил задание - написать программу на c++, осуществляющую парсинг пдф файла, которая вытаскивает автора, название и краткую аннотацию из файла (который подразумевает под собой какую-нибудь статью)

Начал гуглить и яндексить сразу и на всех языках) На наших форумах такие вопросы остаются без ответов.. (надеюсь не в этот раз!), на англоязычных форумах нужной информации тоже не нашёл. В общем, ни как парсить пдф, ни как парсить на с++ - так и не понял...

Если вдруг кто-то поможет разобраться с заданием, объяснит, как можно парсить текстовые пдф-файлы на с++ - буду категорически признателен!
(Если кто-то и с заданием поможет - с меня пивко)
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
10.07.2020, 13:57
Ответы с готовыми решениями:

Защита текстовых файлов от копирования
Здравствуйте) помогите написать программу защити текстовых файлов от копирования. (принцип защиты - от копирования; механизм защиты -...

Считывание Кириллицы с текстовых файлов
В ходе написания программы столкнулся с проблемой. Дело в том, что когда я пытаюсь считать русский текст с файла, используя переменную...

Регулярные выражения. Парсинг текстовых файлов
Прошу пример парсинга например, 2-го слова фразы "hello world 2018". Вроде бы просто, но никак не выходит. int main() { ...

1
19500 / 10105 / 2461
Регистрация: 30.01.2014
Сообщений: 17,818
11.07.2020, 18:47
Zipri, если задача написать парсер с нуля, то вам нужно читать спецификацию на формат PDF, во всем там разобраться, а только потом писать код.
Вполне естественно, что решение такого задания останется без ответа, потому что мало кто захочет делать это бесплатно.

Если же вам просто нужно прочитать какой-то pdf файл, без написания собственного парсера, то ваш вариант - найти готовую библиотеку для С или С++ и подключить ее в ваш проект на С++. Такая библиотека есть, называется PoDoFo.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
11.07.2020, 18:47
Помогаю со студенческими работами здесь

Чтение текстовых файлов
Добрый день) У меня такая проблема, написала программу, но преподаватель сказал,что не хватает функции чтения из файла. Я не понимаю, как...

Обработчик текстовых файлов
Добрый день,прошу помощи в этом нелегком(для меня ) задании ! Написать программу-обработчик текстовых файлов, создающую текстовый файл, в...

Обработка текстовых файлов
Я написал программу, которая выводит с файла допустим dfgdfg dfgdfg dfgdfg dfgdfg dfgdfg dfdfgdf Код: #include...

С использованием текстовых файлов
помогите первокурснице..... Файл содержит целые числа. Вычислить сумму значений из файла, в двоичном представлении которых K...

Соединение 2 текстовых файлов
#include <string.h> int filik (char*j, char*f, char*k) { FILE *F1, *F2, *F3; F1=fopen (j, "r"); if (F1==NULL) return 1; ...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
2
Ответ Создать тему
Новые блоги и статьи
Очистка реквизитов документа при копировании
Maks 09.04.2026
Алгоритм из решения ниже применим как для типовых, так и для нетиповых документов на самых различных конфигурациях. Задача: при копировании документа очищать определенные реквизиты и табличную. . .
модель ЗдравоСохранения 8. Подготовка к разному выполнению заданий
anaschu 08.04.2026
https:/ / github. com/ shumilovas/ med2. git main ветка * содержимое блока дэлэй из старой модели теперь внутри зайца новой модели 8ATzM_2aurI
Блокировка документа от изменений, если он открыт у другого пользователя
Maks 08.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа, разработанного в конфигурации КА2. Задача: запретить редактирование документа, если он открыт у другого пользователя. / / . . .
Система безопасности+живучести для сервера-слоя интернета (сети). Двойная привязка.
Hrethgir 08.04.2026
Далее были размышления о системе безопасности. Сообщения с наклонным текстом - мои. А как нам будет можно проверить, что ссылка наша, а не подделана хулиганами, которая выбросит на другую ветку и. . .
Модель ЗдрввоСохранения 7: больше работников, больше ресурсов.
anaschu 08.04.2026
работников и заданий может быть сколько угодно, но настроено всё так, что используется пока что только 20% kYBz3eJf3jQ
Дальние перспективы сервера - слоя сети с космологическим дизайном интефейса карты и логики.
Hrethgir 07.04.2026
Дальнейшее ближайшее планирование вывело к размышлениям над дальними перспективами. И вот тут может быть даже будут нужны оценки специалистов, так как в дальних перспективах всё может очень сильно. . .
Горе от ума
kumehtar 07.04.2026
Эта мне ментальная установка, что вот прямо сейчас, мол, мне для полного счастья не хватает (нужное вписать), и когда я этого достигну - тогда и полный кайф. Одна из самых сильных ловушек на пути. . . .
Использование значений реквизитов справочника в документе, с определенными условиями и правами
Maks 07.04.2026
1. Контроль срока действия договора Алгоритм из решения ниже реализован на примере нетипового документа "ЗаявкаНаРаботу", разработанного в конфигурации КА2. Задача: уведомлять пользователя, если. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru