Форум программистов, компьютерный форум CyberForum.ru

Распознаватель речи - C++

Восстановить пароль Регистрация
 
Хулиган
 Аватар для Хулиган
85 / 80 / 12
Регистрация: 08.08.2012
Сообщений: 737
12.07.2015, 16:44     Распознаватель речи #1
Здравствуйте!
Хочу написать программу в которой нужно будет преобразовывать звук в текст и делать с ним определенные действия.
Для этого нужен распознаватель речи, готовый брать не хочу, т.к. есть время и желание сделать самому!
Подскажите литературу по данной теме без лишней воды! И если возможно дайте оценку сложности - под силу ли данная задача начинающему?
После регистрации реклама в сообщениях будет скрыта и будут доступны все возможности форума.
Nick Alte
Эксперт С++
1590 / 982 / 115
Регистрация: 27.09.2009
Сообщений: 1,897
Завершенные тесты: 1
12.07.2015, 17:10     Распознаватель речи #2
Это смотря какой начинающий. Если у него математическая подготовка ого-го, и слова вроде "быстрое преобразование Фурье", "математическое ожидание", "сети Кохонена" и "регрессионный анализ" для него не персонажи фильма ужасов, а знакомые и привычные понятия - тогда под силу. Ну а если нет, то до результатов путь долгий. Не скажу, что непреодолимый, но изучить придётся немало.

P.S. Ни в коем случае не надо принимать приведнные мной навскидку примеры за необходимый (или тем более достаточный) для задачи распознавания список тем.
Хулиган
 Аватар для Хулиган
85 / 80 / 12
Регистрация: 08.08.2012
Сообщений: 737
12.07.2015, 17:20  [ТС]     Распознаватель речи #3
Цитата Сообщение от Nick Alte Посмотреть сообщение
Ни в коем случае не надо принимать приведнные мной навскидку примеры за необходимый (или тем более достаточный) для задачи распознавания список тем.
ну это понятно. Заодно можно будет применить давно забытые, умные слова на реальных задачах. Вот бы еще литературу толковую найти..
raxp
10140 / 6527 / 475
Регистрация: 28.12.2010
Сообщений: 21,167
Записей в блоге: 1
12.07.2015, 17:34     Распознаватель речи #4
Литература по ЦОС и алгоритмам
Хулиган
 Аватар для Хулиган
85 / 80 / 12
Регистрация: 08.08.2012
Сообщений: 737
12.07.2015, 20:45  [ТС]     Распознаватель речи #5
Это все хорошо, но хотелось бы, что бы ткнули носом в книгу с нужной тематикой. Просто в литературе по ЦОС очень много книг и мне, делающему только первые шаги, трудно выбрать то что надо.
Nick Alte
Эксперт С++
1590 / 982 / 115
Регистрация: 27.09.2009
Сообщений: 1,897
Завершенные тесты: 1
12.07.2015, 21:15     Распознаватель речи #6
Распознавание речи вообще очень сложная и проблемная штука.
Теоретически, надо анализировать спектр сигнала и выделять отдельные фонемы и сочетания фонем статистическими методами вроде нейросетей. Тут уже не помешают определённые познания в лингвистике.
Но есть адова проблема, которая заключается в том, что люди, подлецы такие, очень невнятно говорят. Мозгу приходится подстраиваться исходя из контекста и ожиданий (наверняка каждый может вспомнить примеры из своей жизни, когда звучащая совершенно невнятно фраза после того, как смысл хотя бы частично ухвачен, начинает звучать намного более членораздельно). То, что в действительности приходит к нам в ухо, довольно сильно отличается от того, что мы слышим.
Получается, что для качественного распознавания речи надо понимать смысл произносимого, выстраивать контекст и предугадывать то, что может быть сказано далее. Нужен полноценный искусственный интеллект. Ну а при наличии отсутствия такового имеем то, что имеем: гугля, эпля и мелкозавры сумели выкатить что-то на основе своих обширных исследований и гигантских массивов данных, да и то работает через пень-колоду.
castaway
Эксперт С++
4846 / 2985 / 368
Регистрация: 10.11.2010
Сообщений: 11,026
Записей в блоге: 10
Завершенные тесты: 1
12.07.2015, 21:33     Распознаватель речи #7
Полностью согласен с Nick Alte. Ты выбрал через чур сложную задачу для начинающего.
raxp
10140 / 6527 / 475
Регистрация: 28.12.2010
Сообщений: 21,167
Записей в блоге: 1
12.07.2015, 21:36     Распознаватель речи #8
что бы ткнули носом в книгу с нужной тематикой
без проблем, даже макну:
Кликните здесь для просмотра всего текста
Распознаватель речи
Распознаватель речи
Распознаватель речи
Распознаватель речи
Распознаватель речи
Распознаватель речи


НИИ десятки лет бились и продолжают биться с миллионами вложений, а начинающим все кажется так просто и в одном месте
Хулиган
 Аватар для Хулиган
85 / 80 / 12
Регистрация: 08.08.2012
Сообщений: 737
12.07.2015, 22:28  [ТС]     Распознаватель речи #9
Цитата Сообщение от castaway Посмотреть сообщение
Полностью согласен с Nick Alte. Ты выбрал через чур сложную задачу для начинающего.
Цитата Сообщение от raxp Посмотреть сообщение
НИИ десятки лет бились и продолжают биться с миллионами вложений, а начинающим все кажется так просто и в одном месте
про то, что здесь все просто я и не говорил! просто просил книжку(а не тысячи ссылок), с помощью которой можно просто вникнуть в эту тему и уже имея представление, выбирать из предложенных ссылок. Я понимаю, что скорее всего, у меня ничего хорошего не получиться. Но если хочется, почему бы не попробовать.
castaway
Эксперт С++
4846 / 2985 / 368
Регистрация: 10.11.2010
Сообщений: 11,026
Записей в блоге: 10
Завершенные тесты: 1
12.07.2015, 22:42     Распознаватель речи #10
Цитата Сообщение от Хулиган Посмотреть сообщение
про то, что здесь все просто я и не говорил! просто просил книжку(а не тысячи ссылок)
Ну так, 8-е сообщение.
MoreAnswers
Эксперт
37091 / 29110 / 5898
Регистрация: 17.06.2006
Сообщений: 43,301
13.07.2015, 06:48     Распознаватель речи
Еще ссылки по теме:

Delphi Запись речи, отправка файла на Google, получение текста речи
C++ Нужна какая-нибудь библиотека для распознавания речи под Windows
Visual Basic .NET Ошибка распознавания речи: Распознаватель не установлен

Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
raxp
10140 / 6527 / 475
Регистрация: 28.12.2010
Сообщений: 21,167
Записей в блоге: 1
13.07.2015, 06:48     Распознаватель речи #11
TC, будьте объективны, вам даны не тысячи ссылок, это раз. И вы игнорируете вышесказанное, это два.
Yandex
Объявления
13.07.2015, 06:48     Распознаватель речи
Ответ Создать тему
Опции темы

Текущее время: 01:28. Часовой пояс GMT +3.
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2016, vBulletin Solutions, Inc.
Рейтинг@Mail.ru