Форум программистов, компьютерный форум, киберфорум
Наши страницы
Программирование Android
Войти
Регистрация
Восстановить пароль
 
Рейтинг 4.56/9: Рейтинг темы: голосов - 9, средняя оценка - 4.56
yura91
1 / 25 / 2
Регистрация: 23.10.2013
Сообщений: 2,326
1

Инструментарий Java для считывания PDF файла в программу

13.03.2015, 13:03. Просмотров 1733. Ответов 8
Метки нет (Все метки)

Как прочитать pdf файл в программу?? Какие есть для этого инструменты java?? Можете привести фрагмент кода или пример чтения данных из pdf ??
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
Similar
Эксперт
41792 / 34177 / 6122
Регистрация: 12.04.2006
Сообщений: 57,940
13.03.2015, 13:03
Ответы с готовыми решениями:

Написать программу для считывания содержимого текстового файла
1 написать программу для считывания содержимого текстового файла. 2 Написать...

Написать программу для считывания элементов матрицы размером М х N из файла
Помогите решить такую проблему. Задача проста но суть в том чтобы не...

Нужна java-программа для чтения электронных книг в формате PDF. Или как можно переделать PDF книгу в вордовский файл?
Нужна java- программа для чтения электронных книг в формате PDF. Нужна очень...

Создать программу считывания произвольного файла и создание нового нетипизированного файла, копируя блоками
Создать программу считывания произвольного файла и создание нового...

Отрисовка содержимого pdf файла в окне java
Уважаемые форумчане, вопрос следующего порядка: в сети нашел вроде как...

8
dajver
410 / 274 / 22
Регистрация: 18.09.2010
Сообщений: 1,114
13.03.2015, 14:18 2
http://stackoverflow.com/a/10352422/520349
0
quwy
Native x86
3338 / 2184 / 650
Регистрация: 13.02.2013
Сообщений: 7,239
13.03.2015, 14:22 3
Цитата Сообщение от yura91 Посмотреть сообщение
Можете привести фрагмент кода или пример чтения данных из pdf ??
Вам нужно его просто отобразить или вынуть какой-то текст?
0
yura91
1 / 25 / 2
Регистрация: 23.10.2013
Сообщений: 2,326
15.03.2015, 21:22  [ТС] 4
и отобразить и вынуть текст тоже куда то в буфер можете привести фрагмент кода для этих вариантов?? А не подскажете как подключить библиотеку Qt чтоб ее можно было использовать в андроид проектах в Android Studio??

Добавлено через 1 минуту
Как вынуть текст в буфер из pdf файла можете фрагмент кода привести??
0
quwy
Native x86
3338 / 2184 / 650
Регистрация: 13.02.2013
Сообщений: 7,239
16.03.2015, 12:54 5
Цитата Сообщение от yura91 Посмотреть сообщение
Как вынуть текст в буфер из pdf файла можете фрагмент кода привести??
Крайне нетривиальная и в общем случае неразрешимая задача. Фрагментом кода тут не отделаться. Самый надежный способ извлечения текста из PDF -- это отрендерить его в битмап и распознать одним из OCR-движков.

Можно попытать счастья с платными библиотеками типа pdf2txt.dll. Еще можно использовать COM-ядро полновесного Adobe Acrobat (не Reader):
Код
AcroApplication = CreateOleObject('AcroExch.PDDoc');
AcroApplication.Open('file.pdf');
JSObj = AcroApplication.GetJSObject;
JSObj.SaveAs('file.txt', 'com.adobe.acrobat.plain-text');
JSObj.CloseDoc;
AcroApplication.Close;
0
yura91
1 / 25 / 2
Регистрация: 23.10.2013
Сообщений: 2,326
16.03.2015, 14:21  [ТС] 6
а что такое OCR движок?? А из вордовского документа как лучше извлекать данные??
0
quwy
Native x86
3338 / 2184 / 650
Регистрация: 13.02.2013
Сообщений: 7,239
16.03.2015, 14:40 7
Цитата Сообщение от yura91 Посмотреть сообщение
а что такое OCR движок?
Optical character recognition -- оптическое распознавание текста, FineReader и иже с ним. Но, раз тема уже в форуме по Android, то не вариант, как и сторонние DLL.

Цитата Сообщение от yura91 Посмотреть сообщение
А из вордовского документа как лучше извлекать данные?
Под андроидом -- не знаю, в винде через COM-объекты установленного в системе Word.
0
yura91
1 / 25 / 2
Регистрация: 23.10.2013
Сообщений: 2,326
16.03.2015, 16:41  [ТС] 8
Java
1
2
3
4
5
6
AcroApplication = CreateOleObject('AcroExch.PDDoc');
AcroApplication.Open('file.pdf');
JSObj = AcroApplication.GetJSObject;
JSObj.SaveAs('file.txt', 'com.adobe.acrobat.plain-text');
JSObj.CloseDoc;
AcroApplication.Close;
этот код читает текст pdf в обькт и пишет в текстовый файл а как прочитать pdf в обьект и затем этот обьект преобразовать в массив или JSObj распарсить надо??
0
quwy
Native x86
3338 / 2184 / 650
Регистрация: 13.02.2013
Сообщений: 7,239
16.03.2015, 17:50 9
Цитата Сообщение от yura91 Посмотреть сообщение
этот код читает текст pdf в обькт и пишет в текстовый файл а как прочитать pdf в обьект и затем этот обьект преобразовать в массив или JSObj распарсить надо??
Этот код работает только в Windows и только при наличии установленной полной платной версии Adobe Acrobat, так что отбой.
0
16.03.2015, 17:50
MoreAnswers
Эксперт
37091 / 29110 / 5898
Регистрация: 17.06.2006
Сообщений: 43,301
16.03.2015, 17:50

Поогите написать программу считывания произвольного количества строк из текстового файла
Ну вводиш в программу файл например формата txt. В этом файле что то...

Поиск файла для считывания
У меня есть один,дурацкий вопрос - всё впрочем легко просто не могу в нете...

Функция считывания из файла для map
в файле задана последовательность ключ-точка(map<string,MYPOINT>). Помогите,...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
9
Ответ Создать тему
Опции темы

КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2018, vBulletin Solutions, Inc.
Рейтинг@Mail.ru