Форум программистов, компьютерный форум, киберфорум
Наши страницы
Программирование Android
Войти
Регистрация
Восстановить пароль
 
yura91
1 / 25 / 2
Регистрация: 23.10.2013
Сообщений: 2,317
#1

Инструментарий Java для считывания PDF файла в программу - Программирование Android

13.03.2015, 13:03. Просмотров 1626. Ответов 8
Метки нет (Все метки)

Как прочитать pdf файл в программу?? Какие есть для этого инструменты java?? Можете привести фрагмент кода или пример чтения данных из pdf ??
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
Similar
Эксперт
41792 / 34177 / 6122
Регистрация: 12.04.2006
Сообщений: 57,940
13.03.2015, 13:03
Я подобрал для вас темы с готовыми решениями и ответами на вопрос Инструментарий Java для считывания PDF файла в программу (Программирование Android):

Написать программу для считывания содержимого текстового файла
1 написать программу для считывания содержимого текстового файла. 2 Написать...

Написать программу для считывания элементов матрицы размером М х N из файла
Помогите решить такую проблему. Задача проста но суть в том чтобы не...

Нужна java-программа для чтения электронных книг в формате PDF. Или как можно переделать PDF книгу в вордовский файл?
Нужна java- программа для чтения электронных книг в формате PDF. Нужна очень...

Создать программу считывания произвольного файла и создание нового нетипизированного файла, копируя блоками
Создать программу считывания произвольного файла и создание нового...

Отрисовка содержимого pdf файла в окне java
Уважаемые форумчане, вопрос следующего порядка: в сети нашел вроде как...

Поогите написать программу считывания произвольного количества строк из текстового файла
Ну вводиш в программу файл например формата txt. В этом файле что то...

8
dajver
410 / 274 / 22
Регистрация: 18.09.2010
Сообщений: 1,114
13.03.2015, 14:18 #2
http://stackoverflow.com/a/10352422/520349
0
quwy
Native x86
3333 / 2180 / 649
Регистрация: 13.02.2013
Сообщений: 7,239
13.03.2015, 14:22 #3
Цитата Сообщение от yura91 Посмотреть сообщение
Можете привести фрагмент кода или пример чтения данных из pdf ??
Вам нужно его просто отобразить или вынуть какой-то текст?
0
yura91
1 / 25 / 2
Регистрация: 23.10.2013
Сообщений: 2,317
15.03.2015, 21:22  [ТС] #4
и отобразить и вынуть текст тоже куда то в буфер можете привести фрагмент кода для этих вариантов?? А не подскажете как подключить библиотеку Qt чтоб ее можно было использовать в андроид проектах в Android Studio??

Добавлено через 1 минуту
Как вынуть текст в буфер из pdf файла можете фрагмент кода привести??
0
quwy
Native x86
3333 / 2180 / 649
Регистрация: 13.02.2013
Сообщений: 7,239
16.03.2015, 12:54 #5
Цитата Сообщение от yura91 Посмотреть сообщение
Как вынуть текст в буфер из pdf файла можете фрагмент кода привести??
Крайне нетривиальная и в общем случае неразрешимая задача. Фрагментом кода тут не отделаться. Самый надежный способ извлечения текста из PDF -- это отрендерить его в битмап и распознать одним из OCR-движков.

Можно попытать счастья с платными библиотеками типа pdf2txt.dll. Еще можно использовать COM-ядро полновесного Adobe Acrobat (не Reader):
Код
AcroApplication = CreateOleObject('AcroExch.PDDoc');
AcroApplication.Open('file.pdf');
JSObj = AcroApplication.GetJSObject;
JSObj.SaveAs('file.txt', 'com.adobe.acrobat.plain-text');
JSObj.CloseDoc;
AcroApplication.Close;
0
yura91
1 / 25 / 2
Регистрация: 23.10.2013
Сообщений: 2,317
16.03.2015, 14:21  [ТС] #6
а что такое OCR движок?? А из вордовского документа как лучше извлекать данные??
0
quwy
Native x86
3333 / 2180 / 649
Регистрация: 13.02.2013
Сообщений: 7,239
16.03.2015, 14:40 #7
Цитата Сообщение от yura91 Посмотреть сообщение
а что такое OCR движок?
Optical character recognition -- оптическое распознавание текста, FineReader и иже с ним. Но, раз тема уже в форуме по Android, то не вариант, как и сторонние DLL.

Цитата Сообщение от yura91 Посмотреть сообщение
А из вордовского документа как лучше извлекать данные?
Под андроидом -- не знаю, в винде через COM-объекты установленного в системе Word.
0
yura91
1 / 25 / 2
Регистрация: 23.10.2013
Сообщений: 2,317
16.03.2015, 16:41  [ТС] #8
Java
1
2
3
4
5
6
AcroApplication = CreateOleObject('AcroExch.PDDoc');
AcroApplication.Open('file.pdf');
JSObj = AcroApplication.GetJSObject;
JSObj.SaveAs('file.txt', 'com.adobe.acrobat.plain-text');
JSObj.CloseDoc;
AcroApplication.Close;
этот код читает текст pdf в обькт и пишет в текстовый файл а как прочитать pdf в обьект и затем этот обьект преобразовать в массив или JSObj распарсить надо??
0
quwy
Native x86
3333 / 2180 / 649
Регистрация: 13.02.2013
Сообщений: 7,239
16.03.2015, 17:50 #9
Цитата Сообщение от yura91 Посмотреть сообщение
этот код читает текст pdf в обькт и пишет в текстовый файл а как прочитать pdf в обьект и затем этот обьект преобразовать в массив или JSObj распарсить надо??
Этот код работает только в Windows и только при наличии установленной полной платной версии Adobe Acrobat, так что отбой.
0
16.03.2015, 17:50
MoreAnswers
Эксперт
37091 / 29110 / 5898
Регистрация: 17.06.2006
Сообщений: 43,301
16.03.2015, 17:50
Привет! Вот еще темы с решениями:

Поиск файла для считывания
У меня есть один,дурацкий вопрос - всё впрочем легко просто не могу в нете...

Функция считывания из файла для map
в файле задана последовательность ключ-точка(map<string,MYPOINT>). Помогите,...

Цикл для построчного считывания из файла
Добрый день, бьюсь над следующей проблемой. Мне необходимо считать из файла,...

Написать программу для считывания новостей
Кто нибудь когда либо создавал программку для считывания новостей с других...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
9
Ответ Создать тему
Опции темы

КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2018, vBulletin Solutions, Inc.
Рейтинг@Mail.ru