Форум программистов, компьютерный форум CyberForum.ru

Инструментарий Java для считывания PDF файла в программу - Android

Восстановить пароль Регистрация
 
yura91
28 / 26 / 2
Регистрация: 23.10.2013
Сообщений: 2,136
13.03.2015, 13:03     Инструментарий Java для считывания PDF файла в программу #1
Как прочитать pdf файл в программу?? Какие есть для этого инструменты java?? Можете привести фрагмент кода или пример чтения данных из pdf ??
После регистрации реклама в сообщениях будет скрыта и будут доступны все возможности форума.
dajver
 Аватар для dajver
406 / 270 / 18
Регистрация: 18.09.2010
Сообщений: 1,106
13.03.2015, 14:18     Инструментарий Java для считывания PDF файла в программу #2
http://stackoverflow.com/a/10352422/520349
quwy
Native x86
 Аватар для quwy
2895 / 1867 / 488
Регистрация: 13.02.2013
Сообщений: 6,251
13.03.2015, 14:22     Инструментарий Java для считывания PDF файла в программу #3
Цитата Сообщение от yura91 Посмотреть сообщение
Можете привести фрагмент кода или пример чтения данных из pdf ??
Вам нужно его просто отобразить или вынуть какой-то текст?
yura91
28 / 26 / 2
Регистрация: 23.10.2013
Сообщений: 2,136
15.03.2015, 21:22  [ТС]     Инструментарий Java для считывания PDF файла в программу #4
и отобразить и вынуть текст тоже куда то в буфер можете привести фрагмент кода для этих вариантов?? А не подскажете как подключить библиотеку Qt чтоб ее можно было использовать в андроид проектах в Android Studio??

Добавлено через 1 минуту
Как вынуть текст в буфер из pdf файла можете фрагмент кода привести??
quwy
Native x86
 Аватар для quwy
2895 / 1867 / 488
Регистрация: 13.02.2013
Сообщений: 6,251
16.03.2015, 12:54     Инструментарий Java для считывания PDF файла в программу #5
Цитата Сообщение от yura91 Посмотреть сообщение
Как вынуть текст в буфер из pdf файла можете фрагмент кода привести??
Крайне нетривиальная и в общем случае неразрешимая задача. Фрагментом кода тут не отделаться. Самый надежный способ извлечения текста из PDF -- это отрендерить его в битмап и распознать одним из OCR-движков.

Можно попытать счастья с платными библиотеками типа pdf2txt.dll. Еще можно использовать COM-ядро полновесного Adobe Acrobat (не Reader):
Код
AcroApplication = CreateOleObject('AcroExch.PDDoc');
AcroApplication.Open('file.pdf');
JSObj = AcroApplication.GetJSObject;
JSObj.SaveAs('file.txt', 'com.adobe.acrobat.plain-text');
JSObj.CloseDoc;
AcroApplication.Close;
yura91
28 / 26 / 2
Регистрация: 23.10.2013
Сообщений: 2,136
16.03.2015, 14:21  [ТС]     Инструментарий Java для считывания PDF файла в программу #6
а что такое OCR движок?? А из вордовского документа как лучше извлекать данные??
quwy
Native x86
 Аватар для quwy
2895 / 1867 / 488
Регистрация: 13.02.2013
Сообщений: 6,251
16.03.2015, 14:40     Инструментарий Java для считывания PDF файла в программу #7
Цитата Сообщение от yura91 Посмотреть сообщение
а что такое OCR движок?
Optical character recognition -- оптическое распознавание текста, FineReader и иже с ним. Но, раз тема уже в форуме по Android, то не вариант, как и сторонние DLL.

Цитата Сообщение от yura91 Посмотреть сообщение
А из вордовского документа как лучше извлекать данные?
Под андроидом -- не знаю, в винде через COM-объекты установленного в системе Word.
yura91
28 / 26 / 2
Регистрация: 23.10.2013
Сообщений: 2,136
16.03.2015, 16:41  [ТС]     Инструментарий Java для считывания PDF файла в программу #8
Java
1
2
3
4
5
6
AcroApplication = CreateOleObject('AcroExch.PDDoc');
AcroApplication.Open('file.pdf');
JSObj = AcroApplication.GetJSObject;
JSObj.SaveAs('file.txt', 'com.adobe.acrobat.plain-text');
JSObj.CloseDoc;
AcroApplication.Close;
этот код читает текст pdf в обькт и пишет в текстовый файл а как прочитать pdf в обьект и затем этот обьект преобразовать в массив или JSObj распарсить надо??
MoreAnswers
Эксперт
37091 / 29110 / 5898
Регистрация: 17.06.2006
Сообщений: 43,301
16.03.2015, 17:50     Инструментарий Java для считывания PDF файла в программу
Еще ссылки по теме:

Как передать byte[] в WebView для отображения PDF ? Android
Выполнение внешнего Java файла или обновление приложения Android
Получение хеша бинарного файла сборки для выполняемого apk-файла Android
Android Изменения параметров layout-файла java-классом
Конфигурация для Java программирования Android

Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
quwy
Native x86
 Аватар для quwy
2895 / 1867 / 488
Регистрация: 13.02.2013
Сообщений: 6,251
16.03.2015, 17:50     Инструментарий Java для считывания PDF файла в программу #9
Цитата Сообщение от yura91 Посмотреть сообщение
этот код читает текст pdf в обькт и пишет в текстовый файл а как прочитать pdf в обьект и затем этот обьект преобразовать в массив или JSObj распарсить надо??
Этот код работает только в Windows и только при наличии установленной полной платной версии Adobe Acrobat, так что отбой.
Yandex
Объявления
16.03.2015, 17:50     Инструментарий Java для считывания PDF файла в программу
Ответ Создать тему
Опции темы

Текущее время: 06:14. Часовой пояс GMT +3.
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2017, vBulletin Solutions, Inc.
Рейтинг@Mail.ru