Реализация алгоритмов распознавания речи26.05.2022, 23:27. Показов 1518. Ответов 15
Метки speech-to-text, speechrecognition, алгоритмы, распознавание, реализация, речь, с/с++ (Все метки)
Подскажите, пожалуйста, алгоритмы, книги, софт и т.п. что поможет в реализации распознавания речи на С/С++!
0
|
|
| 26.05.2022, 23:27 | |
|
Ответы с готовыми решениями:
15
Использование Google Voice Search для распознавания речи Нужна какая-нибудь библиотека для распознавания речи под Windows Реализация синтеза речи |
|
531 / 180 / 39
Регистрация: 18.08.2012
Сообщений: 907
|
|
| 27.05.2022, 02:58 | |
|
такие вещи - проприетарны на сегодняшний момент.
А также - являются темой многомиллионных исследований. Нет какого-то одного алгоритма но, в основном, на данный момент - все делают ставку на искусственный интеллект, а также на сопоставление спектральных характеристик фонем с образцом. Кроме того, при распознавании речи - делается анализ контекста, что помогает различать проблемные слова/фразы. Но, для этого нужна развёрнутая NLP-система. А это - ещё больший геморрой и ещё большие исследования идут и по сей день. Даже у всемогущего google при автогенерации субтитров для видео появляются ошибки.
0
|
|
| 27.05.2022, 23:22 [ТС] | |
|
untyped, так с чего же начать и что такое "развёрнутая NLP-система"?
Хотел еще заметить, что меня,пока,интересует главное направление РР - преобразование звука речи в слова и т.п.,а идентификация голоса - нет.
0
|
|
|
531 / 180 / 39
Регистрация: 18.08.2012
Сообщений: 907
|
|
| 28.05.2022, 01:07 | |
|
например, отсюда:
https://ru.wikipedia.org/wiki/Apache_OpenNLP https://web.archive.org/web/20... enstt.org/ https://ru.wikipedia.org/wiki/... 1%87%D0%B8
0
|
|
| 28.05.2022, 13:05 [ТС] | |
|
untyped,спасибо,буду разбираться! Вообще-то,у меня в голове "крутится" свой алгоритм РР,надо попробовать его реализовать на практике,вот только не оказалось бы,что я заново "открыл Америку",хотя может и оказаться,что я "открою новую Америку"!Время покажет!
0
|
|
|
|
|
| 30.05.2022, 16:46 | |
|
Able man, всё идёт к тому, что высокоуровневая часть задачи распознавания пишется на Пайтоне, а весь этот спектральный анализ и нейросети давно написан в готовых библиотеках и высокоуровневый скрипт тупо вызывает чужие функции в нужной комбинации.
0
|
|
|
|
|
| 31.05.2022, 02:49 | |
|
Able man, на Пайтоне медленно выполняется только передача управления нужной функции из готовой библиотеки, а сама функция внутри давно уже написана умными людьми, которые и ядра проца во множественном количестве умеют использовать и GPU и что только ни делают для быстрого и оптимального распознавания
0
|
|
|
Нарушающий
417 / 305 / 46
Регистрация: 13.04.2022
Сообщений: 1,759
|
|
| 31.05.2022, 07:39 | |
|
Able man, вы хотите чужую покупную распознавалку вызывать, или свою написать, с крутым спектральным анализом и элементами ИИ?
0
|
|
| 31.05.2022, 13:20 [ТС] | |
|
Kuzia domovenok, спасибо, а вот все, что Вы сказали про Пайтон перенести на С/С++, насколько будет лучше и в чем хуже?
QueryMonkey, я буду использовать то, что будет оптимальным для данной задачи!
0
|
|
|
Нарушающий
417 / 305 / 46
Регистрация: 13.04.2022
Сообщений: 1,759
|
|
| 31.05.2022, 16:17 | |
|
Able man, оптимально купить готовое в случая когда не разбираешься в проблеме.
Компании работающие в этой области обладают дюжинами патентов. Если вы их прочтете и что-то поймёте, там описаны эффективные методы которые вам использовать нельзя.
0
|
|
| 31.05.2022, 18:11 [ТС] | |
|
QueryMonkey, а если я сам "открою Америку" и воспользуюсь ей в своей программе,не зная,что эта "Америка" уже запатентована? А как держатели патента узнают,что я применил их запатентованный метод,если я "трепать языком" не буду,а результат будет в скомпилированном виде?И наконец,я и сам могу открыть "новую Америку" - чем черт не шутит!
0
|
|
|
Нарушающий
417 / 305 / 46
Регистрация: 13.04.2022
Сообщений: 1,759
|
|
| 31.05.2022, 19:14 | |
|
Able man, к тому времени как вы поднимите свой уровень знаний чтобы самостоятельно сделать распознавание речи на уровне 1980, вы уже будете знать ответы на эти вопросы.
Но чтобы построить карьеру в области распознавания речи, придется отказаться от развития всех других перспективных идей, от 8-фазного тока до охлаждения цпу жидким калием. (Калием, не перепутайте). Не лучше ли выбрать что-то уникальное, например переднеприводной велосипед с автоматической коробкой передач? В автоиндустрии такое нововведение привело к прорыву.
0
|
|
|
|
|
| 01.06.2022, 13:21 | |
|
Able man, да, что-то он куда-то с темы съехал на велосипеде
0
|
|
|
|
|
| 03.06.2022, 13:30 | |
|
Able man, я тебя шокирую, но всем плевать на то как ты используешь чужие идеи и как чужие используют твои идеи.
Идеи продаются в нашем мире по 10 центов за дюжину.
0
|
|
| 03.06.2022, 13:30 | |
|
Помогаю со студенческими работами здесь
16
Реализация циклических алгоритмов Реализация алгоритмов сортировки Реализация циклических алгоритмов Реализация циклических алгоритмов Реализация алгоритмов сортировок Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
| Опции темы | |
|
|
Новые блоги и статьи
|
|||
|
Камера Toupcam IUA500KMA
Eddy_Em 12.02.2026
Т. к. у всяких "хикроботов" слишком уж мелкий пиксель, для подсмотра в ESPriF они вообще плохо годятся: уже 14 величину можно рассмотреть еле-еле лишь на экспозициях под 3 секунды (а то и больше),. . .
|
И ясному Солнцу
zbw 12.02.2026
И ясному Солнцу,
и светлой Луне.
В мире
покоя нет
и люди
не могут жить в тишине.
А жить им немного лет.
|
«Знание-Сила»
zbw 12.02.2026
«Знание-Сила»
«Время-Деньги»
«Деньги -Пуля»
|
SDL3 для Web (WebAssembly): Подключение Box2D v3, физика и отрисовка коллайдеров
8Observer8 12.02.2026
Содержание блога
Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами и вызывать обработчики событий столкновения. . . .
|
|
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 11.02.2026
Содержание блога
Библиотека SDL3 содержит встроенные инструменты для базовой работы с изображениями - без использования библиотеки SDL3_image. Пошагово создадим проект для загрузки изображения. . .
|
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL3_image
8Observer8 10.02.2026
Содержание блога
Библиотека SDL3_image содержит инструменты для расширенной работы с изображениями. Пошагово создадим проект для загрузки изображения формата PNG с альфа-каналом (с прозрачным. . .
|
Установка Qt-версии Lazarus IDE в Debian Trixie Xfce
volvo 10.02.2026
В общем, достали меня глюки IDE Лазаруса, собранной с использованием набора виджетов Gtk2 (конкретно: если набирать текст в редакторе и вызвать подсказку через Ctrl+Space, то после закрытия окошка. . .
|
SDL3 для Web (WebAssembly): Работа со звуком через SDL3_mixer
8Observer8 08.02.2026
Содержание блога
Пошагово создадим проект для загрузки звукового файла и воспроизведения звука с помощью библиотеки SDL3_mixer. Звук будет воспроизводиться по клику мышки по холсту на Desktop и по. . .
|