Форум программистов, компьютерный форум, киберфорум
Python для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.53/88: Рейтинг темы: голосов - 88, средняя оценка - 4.53
3 / 2 / 2
Регистрация: 16.03.2015
Сообщений: 188

Распознание текста с tesseract на различных языках

28.10.2019, 00:33. Показов 16911. Ответов 10
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Доброй ночи форумчане.

Возможно кто то подскажет в чем проблем.
Подключил другой язык в tesseract, файл tessdata с языками закинул в Tesseract-OCR (Версия 4.0).


Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
try:
    from PIL import Image
except ImportError:
    import Image
import pytesseract
 
def ocr_core(filename):
    """
    This function will handle the core OCR processing of images.
    """
    text = pytesseract.image_to_string(Image.open(filename), lang='rus')
    return text
 
print(ocr_core('F:/ocr_core/test.png'))
Но все же получаю ошибки -
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
Traceback (most recent call last):
  File "core_ocr.py", line 14, in <module>
    print(ocr_core('F:/ocr_core/test.png'))
  File "core_ocr.py", line 11, in ocr_core
    text = pytesseract.image_to_string(Image.open(filename), lang='rus')
  File "F:\ocr_core\venv\lib\site-packages\pytesseract\pytesseract.py", line 345, in image_to_string
    }[output_type]()
  File "F:\ocr_core\venv\lib\site-packages\pytesseract\pytesseract.py", line 344, in <lambda>
    Output.STRING: lambda: run_and_get_output(*args),
  File "F:\ocr_core\venv\lib\site-packages\pytesseract\pytesseract.py", line 253, in run_and_get_output
    run_tesseract(**kwargs)
  File "F:\ocr_core\venv\lib\site-packages\pytesseract\pytesseract.py", line 229, in run_tesseract
    raise TesseractError(proc.returncode, get_errors(error_string))
pytesseract.pytesseract.TesseractError: (3221225477, '')
Английский распознает без проблем.. В чем же дело ?
0
Лучшие ответы (1)
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
28.10.2019, 00:33
Ответы с готовыми решениями:

Передача параметра из cmd на различных языках
Добрый день. Есть bat-файл: powershell.exe -noprofile -executionpolicy bypass -file &quot;C:\7\conf.ps1&quot; &quot;C:\7\même déjà.pptx&quot; Pause ...

Распознание текста
Есть строка 110001001010. Нужно по символьно проверит ee. И если совпадение с вариантом из map заменить на ключ. Например элемент mар ...

Распознание текста
Всем привет! Помогите пожалуйста! При запуске кода на Python через консоль выводит ошибку loop took 0.277083158493042 seconds ...

10
Автоматизируй это!
Эксперт Python
 Аватар для Welemir1
7391 / 4818 / 1246
Регистрация: 30.03.2015
Сообщений: 13,693
Записей в блоге: 29
28.10.2019, 07:10
Цитата Сообщение от Глеб Иванов Посмотреть сообщение
TesseractError: (3221225477
поискал что за проблема?
в доках тессеракт что про русский пишут -поддерживается?
1
3 / 2 / 2
Регистрация: 16.03.2015
Сообщений: 188
28.10.2019, 08:34  [ТС]
Цитата Сообщение от Welemir1 Посмотреть сообщение
поискал что за проблема?
в доках тессеракт что про русский пишут -поддерживается?

Ошибка общего краша тессеракт.
В том то и дело что треинфайлы для языков есть, поддержка на 4.0 тесеракта есть, в гугле примеры работают.
Мне нужен русский и украинский, но найти решение проблемы так и не смог.
0
Автоматизируй это!
Эксперт Python
 Аватар для Welemir1
7391 / 4818 / 1246
Регистрация: 30.03.2015
Сообщений: 13,693
Записей в блоге: 29
28.10.2019, 08:40
Глеб Иванов, ну вот 1 чувачок пишет что не ту версию тессеракта постаил при такой же ошибке.
Какая ОС? 64 бит? какую версию тессеракта ставил, откуда качал? питон версия?

Добавлено через 1 минуту
еще один пишет что ему помогло понизить версию тессеракта -3.5 поставил
1
3 / 2 / 2
Регистрация: 16.03.2015
Сообщений: 188
28.10.2019, 08:40  [ТС]
Цитата Сообщение от Welemir1 Посмотреть сообщение
ну вот 1 чувачок пишет что не ту версию тессеракта постаил при такой же ошибке.
Какая ОС? 64 бит? какую версию тессеракта ставил, откуда качал? питон версия?
Винда 64. Питон 3.7. Тессеракт 4.0, скачал екзешником
0
Автоматизируй это!
Эксперт Python
 Аватар для Welemir1
7391 / 4818 / 1246
Регистрация: 30.03.2015
Сообщений: 13,693
Записей в блоге: 29
28.10.2019, 08:42
Глеб Иванов, так вот ты не дев-версию скачал? посмотри там варианты скачки надо что то со словами стейбл или релиз, можно даже версии подревнее.
1
3 / 2 / 2
Регистрация: 16.03.2015
Сообщений: 188
28.10.2019, 08:42  [ТС]
Цитата Сообщение от Welemir1 Посмотреть сообщение
так вот ты не дев-версию скачал? посмотри там варианты скачки надо что то со словами стейбл или релиз, можно даже версии подревнее.
Как раз в конце и пишет dev
0
Автоматизируй это!
Эксперт Python
 Аватар для Welemir1
7391 / 4818 / 1246
Регистрация: 30.03.2015
Сообщений: 13,693
Записей в блоге: 29
28.10.2019, 08:43
Лучший ответ Сообщение было отмечено Глеб Иванов как решение

Решение

Глеб Иванов, нужно не дев, стабильную версию для 64 бит.
1
3 / 2 / 2
Регистрация: 16.03.2015
Сообщений: 188
28.10.2019, 08:50  [ТС]
Цитата Сообщение от Welemir1 Посмотреть сообщение
нужно не дев, стабильную версию для 64 бит.
Насколько я понимаю стабильной версии вообще нету
Миниатюры
Распознание текста с tesseract на различных языках  
0
3 / 2 / 2
Регистрация: 16.03.2015
Сообщений: 188
28.10.2019, 08:56  [ТС]
Цитата Сообщение от Welemir1 Посмотреть сообщение
нужно не дев, стабильную версию для 64 бит.
Действительно! Заработало !! Ура) Спасибо
0
Автоматизируй это!
Эксперт Python
 Аватар для Welemir1
7391 / 4818 / 1246
Регистрация: 30.03.2015
Сообщений: 13,693
Записей в блоге: 29
28.10.2019, 09:02
Глеб Иванов,
1
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
28.10.2019, 09:02
Помогаю со студенческими работами здесь

Распознавание текста на русском языке (Tesseract 3)
кто-нибудь сталкивался с задачей распознования русского текста на шарпе? на https://code.google.com/p/tesseract-ocr/ есть исходники, но...

распознание текста ocr
Нужно распознать рукописный текст, подскажите метод распознание образов, что лучше использовать? Добавлено через 44 минуты Это не...

Распознание текста с фото
Мне нужен софт.который будет чекать текст на наличии моего с картинки.передавая аргументы.через бат-вбс.

Не правильное распознание текста
вот такую штуку маткад выдает при открытии.....что делать

Распознание текста с картинки
Подскажите, кто силен в этом, каким методом распознавание легче распознать текст, после оконтуривание его методом “Жук” . Вот после...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
11
Ответ Создать тему
Новые блоги и статьи
делаю науч статью по влиянию грибов на сукцессию
anaschu 13.03.2026
прикрепляю статью
SDL3 для Desktop (MinGW): Создаём пустое окно с нуля для 2D-графики на SDL3, Си и C++
8Observer8 10.03.2026
Содержание блога Финальные проекты на Си и на C++: hello-sdl3-c. zip hello-sdl3-cpp. zip Результат:
Установка CMake и MinGW 13.1 для сборки С и C++ приложений из консоли и из Qt Creator в EXE
8Observer8 10.03.2026
Содержание блога MinGW - это коллекция инструментов для сборки приложений в EXE. CMake - это система сборки приложений. Здесь описаны базовые шаги для старта программирования с помощью CMake и. . .
Как дизайн сайта влияет на конверсию: 7 решений, которые реально повышают заявки
Neotwalker 08.03.2026
Многие до сих пор воспринимают дизайн сайта как “красивую оболочку”. На практике всё иначе: дизайн напрямую влияет на то, оставит человек заявку или уйдёт через несколько секунд. Даже если у вас. . .
Модульная разработка через nuget packages
DevAlt 07.03.2026
Сложившийся в . Net-среде способ разработки чаще всего предполагает монорепозиторий в котором находятся все исходники. При создании нового решения, мы просто добавляем нужные проекты и имеем. . .
Модульный подход на примере F#
DevAlt 06.03.2026
В блоге дяди Боба наткнулся на такое определение: В этой книге («Подход, основанный на вариантах использования») Ивар утверждает, что архитектура программного обеспечения — это структуры,. . .
Управление камерой с помощью скрипта OrbitControls.js на Three.js: Вращение, зум и панорамирование
8Observer8 05.03.2026
Содержание блога Финальная демка в браузере работает на Desktop и мобильных браузерах. Итоговый код: orbit-controls-threejs-js. zip. Сканируйте QR-код на мобильном. Вращайте камеру одним пальцем,. . .
SDL3 для Web (WebAssembly): Синхронизация спрайтов SDL3 и тел Box2D
8Observer8 04.03.2026
Содержание блога Финальная демка в браузере. Итоговый код: finish-sync-physics-sprites-sdl3-c. zip На первой гифке отладочные линии отключены, а на второй включены:. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru