С Новым годом! Форум программистов, компьютерный форум, киберфорум
Python для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.53/88: Рейтинг темы: голосов - 88, средняя оценка - 4.53
3 / 2 / 2
Регистрация: 16.03.2015
Сообщений: 188

Распознание текста с tesseract на различных языках

28.10.2019, 00:33. Показов 16847. Ответов 10
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Доброй ночи форумчане.

Возможно кто то подскажет в чем проблем.
Подключил другой язык в tesseract, файл tessdata с языками закинул в Tesseract-OCR (Версия 4.0).


Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
try:
    from PIL import Image
except ImportError:
    import Image
import pytesseract
 
def ocr_core(filename):
    """
    This function will handle the core OCR processing of images.
    """
    text = pytesseract.image_to_string(Image.open(filename), lang='rus')
    return text
 
print(ocr_core('F:/ocr_core/test.png'))
Но все же получаю ошибки -
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
Traceback (most recent call last):
  File "core_ocr.py", line 14, in <module>
    print(ocr_core('F:/ocr_core/test.png'))
  File "core_ocr.py", line 11, in ocr_core
    text = pytesseract.image_to_string(Image.open(filename), lang='rus')
  File "F:\ocr_core\venv\lib\site-packages\pytesseract\pytesseract.py", line 345, in image_to_string
    }[output_type]()
  File "F:\ocr_core\venv\lib\site-packages\pytesseract\pytesseract.py", line 344, in <lambda>
    Output.STRING: lambda: run_and_get_output(*args),
  File "F:\ocr_core\venv\lib\site-packages\pytesseract\pytesseract.py", line 253, in run_and_get_output
    run_tesseract(**kwargs)
  File "F:\ocr_core\venv\lib\site-packages\pytesseract\pytesseract.py", line 229, in run_tesseract
    raise TesseractError(proc.returncode, get_errors(error_string))
pytesseract.pytesseract.TesseractError: (3221225477, '')
Английский распознает без проблем.. В чем же дело ?
0
Лучшие ответы (1)
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
28.10.2019, 00:33
Ответы с готовыми решениями:

Передача параметра из cmd на различных языках
Добрый день. Есть bat-файл: powershell.exe -noprofile -executionpolicy bypass -file &quot;C:\7\conf.ps1&quot; &quot;C:\7\même déjà.pptx&quot; Pause ...

Распознание текста
Есть строка 110001001010. Нужно по символьно проверит ee. И если совпадение с вариантом из map заменить на ключ. Например элемент mар ...

Распознание текста
Всем привет! Помогите пожалуйста! При запуске кода на Python через консоль выводит ошибку loop took 0.277083158493042 seconds ...

10
Автоматизируй это!
Эксперт Python
 Аватар для Welemir1
7390 / 4817 / 1246
Регистрация: 30.03.2015
Сообщений: 13,666
Записей в блоге: 29
28.10.2019, 07:10
Цитата Сообщение от Глеб Иванов Посмотреть сообщение
TesseractError: (3221225477
поискал что за проблема?
в доках тессеракт что про русский пишут -поддерживается?
1
3 / 2 / 2
Регистрация: 16.03.2015
Сообщений: 188
28.10.2019, 08:34  [ТС]
Цитата Сообщение от Welemir1 Посмотреть сообщение
поискал что за проблема?
в доках тессеракт что про русский пишут -поддерживается?

Ошибка общего краша тессеракт.
В том то и дело что треинфайлы для языков есть, поддержка на 4.0 тесеракта есть, в гугле примеры работают.
Мне нужен русский и украинский, но найти решение проблемы так и не смог.
0
Автоматизируй это!
Эксперт Python
 Аватар для Welemir1
7390 / 4817 / 1246
Регистрация: 30.03.2015
Сообщений: 13,666
Записей в блоге: 29
28.10.2019, 08:40
Глеб Иванов, ну вот 1 чувачок пишет что не ту версию тессеракта постаил при такой же ошибке.
Какая ОС? 64 бит? какую версию тессеракта ставил, откуда качал? питон версия?

Добавлено через 1 минуту
еще один пишет что ему помогло понизить версию тессеракта -3.5 поставил
1
3 / 2 / 2
Регистрация: 16.03.2015
Сообщений: 188
28.10.2019, 08:40  [ТС]
Цитата Сообщение от Welemir1 Посмотреть сообщение
ну вот 1 чувачок пишет что не ту версию тессеракта постаил при такой же ошибке.
Какая ОС? 64 бит? какую версию тессеракта ставил, откуда качал? питон версия?
Винда 64. Питон 3.7. Тессеракт 4.0, скачал екзешником
0
Автоматизируй это!
Эксперт Python
 Аватар для Welemir1
7390 / 4817 / 1246
Регистрация: 30.03.2015
Сообщений: 13,666
Записей в блоге: 29
28.10.2019, 08:42
Глеб Иванов, так вот ты не дев-версию скачал? посмотри там варианты скачки надо что то со словами стейбл или релиз, можно даже версии подревнее.
1
3 / 2 / 2
Регистрация: 16.03.2015
Сообщений: 188
28.10.2019, 08:42  [ТС]
Цитата Сообщение от Welemir1 Посмотреть сообщение
так вот ты не дев-версию скачал? посмотри там варианты скачки надо что то со словами стейбл или релиз, можно даже версии подревнее.
Как раз в конце и пишет dev
0
Автоматизируй это!
Эксперт Python
 Аватар для Welemir1
7390 / 4817 / 1246
Регистрация: 30.03.2015
Сообщений: 13,666
Записей в блоге: 29
28.10.2019, 08:43
Лучший ответ Сообщение было отмечено Глеб Иванов как решение

Решение

Глеб Иванов, нужно не дев, стабильную версию для 64 бит.
1
3 / 2 / 2
Регистрация: 16.03.2015
Сообщений: 188
28.10.2019, 08:50  [ТС]
Цитата Сообщение от Welemir1 Посмотреть сообщение
нужно не дев, стабильную версию для 64 бит.
Насколько я понимаю стабильной версии вообще нету
Миниатюры
Распознание текста с tesseract на различных языках  
0
3 / 2 / 2
Регистрация: 16.03.2015
Сообщений: 188
28.10.2019, 08:56  [ТС]
Цитата Сообщение от Welemir1 Посмотреть сообщение
нужно не дев, стабильную версию для 64 бит.
Действительно! Заработало !! Ура) Спасибо
0
Автоматизируй это!
Эксперт Python
 Аватар для Welemir1
7390 / 4817 / 1246
Регистрация: 30.03.2015
Сообщений: 13,666
Записей в блоге: 29
28.10.2019, 09:02
Глеб Иванов,
1
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
28.10.2019, 09:02
Помогаю со студенческими работами здесь

Распознавание текста на русском языке (Tesseract 3)
кто-нибудь сталкивался с задачей распознования русского текста на шарпе? на https://code.google.com/p/tesseract-ocr/ есть исходники, но...

распознание текста ocr
Нужно распознать рукописный текст, подскажите метод распознание образов, что лучше использовать? Добавлено через 44 минуты Это не...

Распознание текста с фото
Мне нужен софт.который будет чекать текст на наличии моего с картинки.передавая аргументы.через бат-вбс.

Не правильное распознание текста
вот такую штуку маткад выдает при открытии.....что делать

Распознание текста с картинки
Подскажите, кто силен в этом, каким методом распознавание легче распознать текст, после оконтуривание его методом “Жук” . Вот после...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
11
Ответ Создать тему
Новые блоги и статьи
Изучаю kubernetes
lagorue 13.01.2026
А пригодятся-ли мне знания kubernetes в России?
Сукцессия микоризы: основная теория в виде двух уравнений.
anaschu 11.01.2026
https:/ / rutube. ru/ video/ 7a537f578d808e67a3c6fd818a44a5c4/
WordPad для Windows 11
Jel 10.01.2026
WordPad для Windows 11 — это приложение, которое восстанавливает классический текстовый редактор WordPad в операционной системе Windows 11. После того как Microsoft исключила WordPad из. . .
Classic Notepad for Windows 11
Jel 10.01.2026
Old Classic Notepad for Windows 11 Приложение для Windows 11, позволяющее пользователям вернуть классическую версию текстового редактора «Блокнот» из Windows 10. Программа предоставляет более. . .
Почему дизайн решает?
Neotwalker 09.01.2026
В современном мире, где конкуренция за внимание потребителя достигла пика, дизайн становится мощным инструментом для успеха бренда. Это не просто красивый внешний вид продукта или сайта — это. . .
Модель микоризы: классовый агентный подход 3
anaschu 06.01.2026
aa0a7f55b50dd51c5ec569d2d10c54f6/ O1rJuneU_ls https:/ / vkvideo. ru/ video-115721503_456239114
Owen Logic: О недопустимости использования связки «аналоговый ПИД» + RegKZR
ФедосеевПавел 06.01.2026
Owen Logic: О недопустимости использования связки «аналоговый ПИД» + RegKZR ВВЕДЕНИЕ Введу сокращения: аналоговый ПИД — ПИД регулятор с управляющим выходом в виде числа в диапазоне от 0% до. . .
Модель микоризы: классовый агентный подход 2
anaschu 06.01.2026
репозиторий https:/ / github. com/ shumilovas/ fungi ветка по-частям. коммит Create переделка под биомассу. txt вход sc, но sm считается внутри мицелия. кстати, обьем тоже должен там считаться. . . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru