30 / 30 / 2
Регистрация: 24.04.2022
Сообщений: 552
Записей в блоге: 2

Реализация алгоритмов распознавания речи

26.05.2022, 23:27. Показов 1518. Ответов 15

Студворк — интернет-сервис помощи студентам
Подскажите, пожалуйста, алгоритмы, книги, софт и т.п. что поможет в реализации распознавания речи на С/С++!
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
26.05.2022, 23:27
Ответы с готовыми решениями:

Использование Google Voice Search для распознавания речи
Доброго времени суток! Нарыл в интернете статейку по использовании Google Voice Search с исходником написанным на C#. Прошу помощи в...

Нужна какая-нибудь библиотека для распознавания речи под Windows
Люди, нужна какая-нибудь библиотека для распознавания речи под Windows. Знаю, что есть SAPI, но как я понял там только синтез речи можно...

Реализация синтеза речи
Программа синтеза речи. Пользователь вводит в Memo(или RichBox, смотря какая среда) какое-то предложение и нажимает на кнопку....

15
531 / 180 / 39
Регистрация: 18.08.2012
Сообщений: 907
27.05.2022, 02:58
такие вещи - проприетарны на сегодняшний момент.
А также - являются темой многомиллионных исследований.
Нет какого-то одного алгоритма но, в основном, на данный момент - все делают ставку на искусственный интеллект, а также на сопоставление спектральных характеристик фонем с образцом.
Кроме того, при распознавании речи - делается анализ контекста, что помогает различать проблемные слова/фразы.
Но, для этого нужна развёрнутая NLP-система. А это - ещё больший геморрой и ещё большие исследования идут и по сей день.

Даже у всемогущего google при автогенерации субтитров для видео появляются ошибки.
0
30 / 30 / 2
Регистрация: 24.04.2022
Сообщений: 552
Записей в блоге: 2
27.05.2022, 23:22  [ТС]
untyped, так с чего же начать и что такое "развёрнутая NLP-система"?
Хотел еще заметить, что меня,пока,интересует главное направление РР - преобразование звука речи в слова и т.п.,а идентификация голоса - нет.
0
531 / 180 / 39
Регистрация: 18.08.2012
Сообщений: 907
28.05.2022, 01:07
например, отсюда:
https://ru.wikipedia.org/wiki/Apache_OpenNLP
https://web.archive.org/web/20... enstt.org/
https://ru.wikipedia.org/wiki/... 1%87%D0%B8
0
30 / 30 / 2
Регистрация: 24.04.2022
Сообщений: 552
Записей в блоге: 2
28.05.2022, 13:05  [ТС]
untyped,спасибо,буду разбираться! Вообще-то,у меня в голове "крутится" свой алгоритм РР,надо попробовать его реализовать на практике,вот только не оказалось бы,что я заново "открыл Америку",хотя может и оказаться,что я "открою новую Америку"!Время покажет!
0
 Аватар для Kuzia domovenok
4268 / 3327 / 926
Регистрация: 25.03.2012
Сообщений: 12,532
Записей в блоге: 1
30.05.2022, 16:46
Able man, всё идёт к тому, что высокоуровневая часть задачи распознавания пишется на Пайтоне, а весь этот спектральный анализ и нейросети давно написан в готовых библиотеках и высокоуровневый скрипт тупо вызывает чужие функции в нужной комбинации.
0
30 / 30 / 2
Регистрация: 24.04.2022
Сообщений: 552
Записей в блоге: 2
30.05.2022, 20:52  [ТС]
Kuzia domovenok, а почему именно на Пайтоне - он же интерпретируемый и медленный?! Неужели из-за его направленности на ИИ и разработанных библиотек?
0
 Аватар для Kuzia domovenok
4268 / 3327 / 926
Регистрация: 25.03.2012
Сообщений: 12,532
Записей в блоге: 1
31.05.2022, 02:49
Able man, на Пайтоне медленно выполняется только передача управления нужной функции из готовой библиотеки, а сама функция внутри давно уже написана умными людьми, которые и ядра проца во множественном количестве умеют использовать и GPU и что только ни делают для быстрого и оптимального распознавания
0
Нарушающий
417 / 305 / 46
Регистрация: 13.04.2022
Сообщений: 1,759
31.05.2022, 07:39
Able man, вы хотите чужую покупную распознавалку вызывать, или свою написать, с крутым спектральным анализом и элементами ИИ?
0
30 / 30 / 2
Регистрация: 24.04.2022
Сообщений: 552
Записей в блоге: 2
31.05.2022, 13:20  [ТС]
Kuzia domovenok, спасибо, а вот все, что Вы сказали про Пайтон перенести на С/С++, насколько будет лучше и в чем хуже?

QueryMonkey, я буду использовать то, что будет оптимальным для данной задачи!
0
Нарушающий
417 / 305 / 46
Регистрация: 13.04.2022
Сообщений: 1,759
31.05.2022, 16:17
Able man, оптимально купить готовое в случая когда не разбираешься в проблеме.
Компании работающие в этой области обладают дюжинами патентов. Если вы их прочтете и что-то поймёте, там описаны эффективные методы которые вам использовать нельзя.
0
30 / 30 / 2
Регистрация: 24.04.2022
Сообщений: 552
Записей в блоге: 2
31.05.2022, 18:11  [ТС]
QueryMonkey, а если я сам "открою Америку" и воспользуюсь ей в своей программе,не зная,что эта "Америка" уже запатентована? А как держатели патента узнают,что я применил их запатентованный метод,если я "трепать языком" не буду,а результат будет в скомпилированном виде?И наконец,я и сам могу открыть "новую Америку" - чем черт не шутит!
0
Нарушающий
417 / 305 / 46
Регистрация: 13.04.2022
Сообщений: 1,759
31.05.2022, 19:14
Able man, к тому времени как вы поднимите свой уровень знаний чтобы самостоятельно сделать распознавание речи на уровне 1980, вы уже будете знать ответы на эти вопросы.

Но чтобы построить карьеру в области распознавания речи, придется отказаться от развития всех других перспективных идей, от 8-фазного тока до охлаждения цпу жидким калием. (Калием, не перепутайте).

Не лучше ли выбрать что-то уникальное, например переднеприводной велосипед с автоматической коробкой передач? В автоиндустрии такое нововведение привело к прорыву.
0
30 / 30 / 2
Регистрация: 24.04.2022
Сообщений: 552
Записей в блоге: 2
31.05.2022, 19:25  [ТС]
QueryMonkey, опять ты не по теме и чушь "несешь"! Она, прям, из тебя, как из "рога изобилия" лезет! Толку от тебя, как с козла - молоко! Или у вас, в СА, и козлов доят?!
0
 Аватар для Kuzia domovenok
4268 / 3327 / 926
Регистрация: 25.03.2012
Сообщений: 12,532
Записей в блоге: 1
01.06.2022, 13:21
Able man, да, что-то он куда-то с темы съехал на велосипеде
0
 Аватар для Kuzia domovenok
4268 / 3327 / 926
Регистрация: 25.03.2012
Сообщений: 12,532
Записей в блоге: 1
03.06.2022, 13:30
Able man, я тебя шокирую, но всем плевать на то как ты используешь чужие идеи и как чужие используют твои идеи.
Идеи продаются в нашем мире по 10 центов за дюжину.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
03.06.2022, 13:30
Помогаю со студенческими работами здесь

Реализация циклических алгоритмов
Для каждого x, изменяющегося от a до b с шагом h, найти значения функции Y(x), суммы S(x) и |Y(x)–S(x)| и вывести в виде таблицы. Значения...

Реализация алгоритмов сортировки
Массив данных заполнять случайным образом. Рассмотреть массивы данных с элементов типа long и char. Использовать перезагрузку функций для...

Реализация циклических алгоритмов
Для каждого x, изменяющегося от a до b с шагом h, найти значения функции Y(x), суммы S(x) и |Y(x)–S(x)| и вывести в виде таблицы. Значения...

Реализация циклических алгоритмов
Считает неправильно..помогите исправить ошибки в обработке формул Для каждого x, изменяющегося от a до b с шагом h, найти значения...

Реализация алгоритмов сортировок
1. Написать функцию со следующим прототипом: void GenerateDataset (char *filename, int num). Функция создает текстовый файл из num строк....


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
16
Ответ Создать тему
Опции темы

Новые блоги и статьи
Камера Toupcam IUA500KMA
Eddy_Em 12.02.2026
Т. к. у всяких "хикроботов" слишком уж мелкий пиксель, для подсмотра в ESPriF они вообще плохо годятся: уже 14 величину можно рассмотреть еле-еле лишь на экспозициях под 3 секунды (а то и больше),. . .
И ясному Солнцу
zbw 12.02.2026
И ясному Солнцу, и светлой Луне. В мире покоя нет и люди не могут жить в тишине. А жить им немного лет.
«Знание-Сила»
zbw 12.02.2026
«Знание-Сила» «Время-Деньги» «Деньги -Пуля»
SDL3 для Web (WebAssembly): Подключение Box2D v3, физика и отрисовка коллайдеров
8Observer8 12.02.2026
Содержание блога Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами и вызывать обработчики событий столкновения. . . .
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 11.02.2026
Содержание блога Библиотека SDL3 содержит встроенные инструменты для базовой работы с изображениями - без использования библиотеки SDL3_image. Пошагово создадим проект для загрузки изображения. . .
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL3_image
8Observer8 10.02.2026
Содержание блога Библиотека SDL3_image содержит инструменты для расширенной работы с изображениями. Пошагово создадим проект для загрузки изображения формата PNG с альфа-каналом (с прозрачным. . .
Установка Qt-версии Lazarus IDE в Debian Trixie Xfce
volvo 10.02.2026
В общем, достали меня глюки IDE Лазаруса, собранной с использованием набора виджетов Gtk2 (конкретно: если набирать текст в редакторе и вызвать подсказку через Ctrl+Space, то после закрытия окошка. . .
SDL3 для Web (WebAssembly): Работа со звуком через SDL3_mixer
8Observer8 08.02.2026
Содержание блога Пошагово создадим проект для загрузки звукового файла и воспроизведения звука с помощью библиотеки SDL3_mixer. Звук будет воспроизводиться по клику мышки по холсту на Desktop и по. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru