Форум программистов, компьютерный форум, киберфорум
Теория программирования
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.83/6: Рейтинг темы: голосов - 6, средняя оценка - 4.83
 Аватар для Greeezly
6 / 6 / 1
Регистрация: 31.08.2012
Сообщений: 230

Теория распознавания текстов и изображений

01.05.2015, 11:20. Показов 1185. Ответов 5
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Дорогие товарищи, очень хочется почитать и вникнуть в теорию распознавания объектов. Полазил в интернете, по нашему форуму. Есть действительно много статей, но ощущение такое, как будто они посвящены каким-то отдельным кускам задачи, совершенно не понятно с чего начать и не видно целостной картины.

Буду признателен за прямые ссылки на хорошую литературу для начинающих по этому вопросу.
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
01.05.2015, 11:20
Ответы с готовыми решениями:

Методы распознавания текстов с изображения (обработка, распознавание пробела) при использовании Нейросетей
как распознать пробел в изображении и такие буквы как "ы" так как если просто резать изображение на куски то получим "ь" и...

Вышла новая версия системы распознавания текстов Cuneiform для Linux
Компания Cognitive Technologies сообщила о том, что международным сообществом независимых разработчиков создана очередная версия системы...

Bootstrap 3, адаптивность изображений и текстов
При уменьшении ширины окна браузера, текст и картинки не уменьшаются, в результате чего текст вылезает за пределы своего блока, а...

5
 Аватар для krapotkin
6847 / 4674 / 1463
Регистрация: 14.04.2014
Сообщений: 20,656
Записей в блоге: 21
01.05.2015, 12:52
нет никакой целостной картины, как нет и "образов"
если тебе надо распознавать образа - это одно
если углы дома и ландшафт - другое
дорожные знаки - третье

на все вместе алгоритмы пока не вскрыты
0
 Аватар для Greeezly
6 / 6 / 1
Регистрация: 31.08.2012
Сообщений: 230
01.05.2015, 13:14  [ТС]
я бы начал с текста
0
2621 / 1632 / 266
Регистрация: 19.02.2010
Сообщений: 4,330
03.05.2015, 22:04
Цитата Сообщение от krapotkin Посмотреть сообщение
на все вместе алгоритмы пока не вскрыты
В задаче ImageNet уже две команды в этом году добились точности менее 5% ошибок. Распознаются полноцветные фото разных объектов/вещей/животных/... разных цветов/размеров/... в разных ракурсах/позах/... на разнообразном фоне. 1000 (прописью: ТЫСЯЧА) распознаваемых классов (фактически, 1000 "слов"-существительных в "выходном" "языке", у пресловутой Эллочки-людоедки было гораааздо меньше).
Что они (гугл и прочие) делают не так?

ЗЫ. <5% ошибок - лучше, чем в среднем эту задачу распознаёт человек (ибо среднему человеку нафиг не надо учить породы собак-кошек и т.д.).

ЗЗЫ. Дорожные знаки - тоже уже распознаются лучше, чем делает человек. Тоже свёрточными/глубокими нейросетками, иной структуры - но тем не менее подход один.

ЗЗЗЫ. Брал Ваши примеры - Вы текст не упомянули, поэтому скажу, что и разметку-сегментирование картинки (например, городской сцены - где небо, где асфальт, где стены домов, где деревья, где люди, авто,...) тоже делают свёрточные/глубокие нейросети.
0
 Аватар для Greeezly
6 / 6 / 1
Регистрация: 31.08.2012
Сообщений: 230
04.05.2015, 11:11  [ТС]
И вы можете что-то порекомендовать почитать?
0
2621 / 1632 / 266
Регистрация: 19.02.2010
Сообщений: 4,330
06.05.2015, 22:41
Greeezly, нет, я уже много лет не слежу за учебниками. И за русскоязычными работами - я тоже не слежу.
Только лишь англоязычные научные статьи и конференционные доклады - а в таких текстах и изложение довольно сжато, и очень узкая проблема рассматривается.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
06.05.2015, 22:41
Помогаю со студенческими работами здесь

Как работает функция распознавания лиц (теория)?
Кто нибудь знает как работает функция распознавания лиц в теории к примеру на facebook cкрипт определяет твоего друга и создает рамку...

Новый способ распознавания изображений - по текстам!
Это поисковая технология, поиск по текстам. Где-то, если админы не удалили, есть описание как она работает. Просто опишите изображение...

Система распознавания на основе преобразования хорд изображений
Помогите может кто сталкивался с такой проблемой. По данной теме «Система распознавания на основе преобразования хорд изображений»...

Библиотека для распознавания изображений. Простая и быстрая. Подскажите пожалуйста
Добрый день. Возникла необходимость программно распознавать некие области на изображении. Суть в следующем: делается скрин экрана...

Где найти реализованный алгоритм распознавания изображений методом случайного леса
Реализация на С++


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
6
Ответ Создать тему
Новые блоги и статьи
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта Симптом: После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
Access
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином. Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов. . . .
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
Создание Single Page Application на фреймах
krapotkin 16.11.2025
Статья исключительно для начинающих. Подходы оригинальностью не блещут. В век Веб все очень привыкли к дизайну Single-Page-Application . Быстренько разберем подход "на фреймах". Мы делаем одну. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru