|
39 / 27 / 12
Регистрация: 31.12.2013
Сообщений: 329
|
||||||
Как получить текст файла PDF (iTextSharp)01.08.2014, 21:08. Показов 10150. Ответов 10
Метки нет (Все метки)
Проблема состоит в том, что если ввести в форму к примеру Полное наименование(смотреть под спойлер текст), то выводит часть ответа или чушь наиполнейшую. Добавил foreach() для фикса при получении ИНН (численных ответов всм) Тогда как быть с string значениями? Кликните здесь для просмотра всего текста
ОГРН 1055907661578
ИНН 5957000039 Полное наименование ОБЩЕСТВО С ОГРАНИЧЕННОЙ ОТВЕТСТВЕННОСТЬЮ "КУЕДА-ЛЕС" Сокращенное наименование ООО "КУЕДА-ЛЕС" Фирменное наименование ОБЩЕСТВО С ОГРАНИЧЕННОЙ ОТВЕТСТВЕННОСТЬЮ "КУЕДА-ЛЕС" Наименование на иностранном языке ОПФ Общество с ограниченной ответственностью Сведения о состоянии юр.лица Действующее Дата формирования сведений из ЕГРЮЛ 16.06.2014 КПП юридического лица 595701001 Дата присвоения ОГРН 18.02.2005 Наименование классификатора по которому введены сведения об ОПФ: ОКОПФ, КОПФ ОКОПФ Код по выбранному классификатору 65 Заранее Спасибо
0
|
||||||
| 01.08.2014, 21:08 | |
|
Ответы с готовыми решениями:
10
Получить значение строки из PDF файла (iTextSharp) Библиотека iTextSharp: как в pdf вставить вертикальный текст Библиотека itextsharp: вырезать определенный кусок текста из PDF и поместить на форму |
|
675 / 421 / 44
Регистрация: 09.07.2012
Сообщений: 1,419
|
|
| 01.08.2014, 21:28 | |
|
Долго смотрел, а что достать нужно только ИНН?
1)Если текст такой то можно использовать "регулярные выражения" - http://professorweb.ru/my/csha... 4/4_10.php Оно вынет вам ИНН с первой попытки из любого текста где он есть. Работает немного дольше чем 2 способ. 2) Можно использовать поиск слова "ИНН" и потом вынуть еще 10-20 символов после него, где и должны находиться числа. Далее через индексы и проверку Char.IsDigit (встроенный в NET метод) вынуть его полностью и правильно. String.IndexOf - метод (String) -> http://msdn.microsoft.com/ru-r... .110).aspx foreach - в вашем случае работает очень медленно. Используйте Char.IsDigit и другие (буква, пробел..) или charmap (Win+R -> charmap), таблица символов, или ASCII коды. И смотрите в какой диапазон входит ваш "чар". Метод ExtractText все равно должен предвидеть исключение, файл может быть не рабочим или просто переименованным в "pdf".
0
|
|
|
39 / 27 / 12
Регистрация: 31.12.2013
Сообщений: 329
|
|
| 01.08.2014, 21:38 [ТС] | |
|
Да это тестовый код)))
Этот код нормально выводит ИНН, а к примеру попросить вывести "Полное наименование", то часть результата выводит. Добавлено через 2 минуты Или еще попросить вывести ИНН, он выведет его и через пробел выводит следующие 6 символов другой строки, такой тоже баг))
0
|
|
|
675 / 421 / 44
Регистрация: 09.07.2012
Сообщений: 1,419
|
|
| 01.08.2014, 21:41 | |
|
Эта часть результата всегда имеет одну длину, не выводит текст после переноса строки?
Если после "Полное наименование" всегда идет "Сокращенное наименование", то тут его и можно вырезать (все что находится между этими константами и есть полное наименование организации). Удалить пробелы в начале и конце строки, удалить перенос строки если есть из всей строки. ИНН не баг, надо знать что он имеет всегда одну длину (для физ и юр лиц разная), все что вам нужно это найти первое число в строке "ИНН хххххххххх тексттексттекст" и вырезать дальше нужное количество символов.
0
|
|
|
39 / 27 / 12
Регистрация: 31.12.2013
Сообщений: 329
|
||||||
| 02.08.2014, 15:51 [ТС] | ||||||
А стринги не выводит. (то есть типа char || string)
0
|
||||||
|
675 / 421 / 44
Регистрация: 09.07.2012
Сообщений: 1,419
|
|
| 02.08.2014, 18:36 | |
|
Вам надо еще раз пройтись по работе с классом string.
Посмотрите видео лекции Кликните здесь для просмотра всего текста
Прочитайте по сайту http://professorweb.ru, там есть все что вам нужно. Если сейчас напишут рабочий метод (не факт что оптимальный), то знаний много это не прибавит.
0
|
|
|
39 / 27 / 12
Регистрация: 31.12.2013
Сообщений: 329
|
|
| 02.08.2014, 21:31 [ТС] | |
|
На данный момент очень мало времени, мягко говоря не успеваю.
После реализации изучу =))))
0
|
|
|
873 / 771 / 173
Регистрация: 11.01.2012
Сообщений: 1,942
|
|
| 02.08.2014, 22:01 | |
|
Напишите хоть что получить хотели. А то обозвали тему "PDF" чтоб никто не догадался.
У вас есть текст и из него надо что-то вытащить?
0
|
|
|
39 / 27 / 12
Регистрация: 31.12.2013
Сообщений: 329
|
|
| 02.08.2014, 22:06 [ТС] | |
|
ДА!
(пример PDF файла) Там есть ИНН, ОГРН и прочее. Нужно вытащить их значения :-) Надеюсь на Вашу поддержку!
0
|
|
|
873 / 771 / 173
Регистрация: 11.01.2012
Сообщений: 1,942
|
|
| 02.08.2014, 22:08 | |
|
0
|
|
|
39 / 27 / 12
Регистрация: 31.12.2013
Сообщений: 329
|
||||||||||||||||||||||||||
| 03.08.2014, 19:18 [ТС] | ||||||||||||||||||||||||||
|
Вытащить их значения
Добавлено через 2 часа 1 минуту
Данный код работает, но я хочу подключить функцию
В Debug выводит ошибку на:
Надеюсь на Вашу помощь :-)
0
|
||||||||||||||||||||||||||
| 03.08.2014, 19:18 | |
|
Помогаю со студенческими работами здесь
11
Как перенести HTML текст в PDF Itextsharp из PDF в текст
ITextSharp, Размещение картинки на PDF Itextsharp зашифровать pdf файл от редактирования Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
||||
|
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта
Симптом:
После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
|
Access
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
|
Новый ноутбук
volvo 07.12.2025
Всем привет.
По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне:
Ryzen 5 7533HS
64 Gb DDR5
1Tb NVMe
16" Full HD Display
Win11 Pro
|
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
|
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
|
|
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов
На странице:
https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/
нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
|
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов.
. . .
|
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
|
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
|
Создание Single Page Application на фреймах
krapotkin 16.11.2025
Статья исключительно для начинающих. Подходы оригинальностью не блещут.
В век Веб все очень привыкли к дизайну Single-Page-Application .
Быстренько разберем подход "на фреймах".
Мы делаем одну. . .
|