|
3 / 3 / 0
Регистрация: 31.08.2013
Сообщений: 25
|
|
Распознавание речи. Google Speech API12.04.2015, 21:13. Показов 12960. Ответов 7
Метки нет (Все метки)
Здравствуйте. Я прикрепляю простую программу для распознавания речи с помощью Google API. Она работает, но есть некоторые вопросы.
1)Пока программа реализована с двумя кнопками: первая кнопка - запись wav-файла, второе нажатие по ней - конец записи, и вторая кнопка - распознать, отправляющая и принимающая ответ. Суть в том, что я хочу, чтобы все действия выполнялись по нажатии одной кнопки, но вылазит исключение о том, что файлом еще пользуются, Вы можете сами это увидеть, если раскомментируете 52 строку. Помогите пожалуйста это исправить. Я пробовал вставлять паузу после 48 строки, но безуспешно. 2) Почему первый запрос так долог? Около 10-15 секунд. И сама программа подвисает... Но потом все в порядке 3) Не совсем по теме. Во вложении находятся все файлы, который создает студия, но наверняка там есть несущественные для подобного распространения, и все время таскать их не обязательно. Скажите пожалуйста, какие файлы нужно переносить, а какие необязательно.
1
|
|
| 12.04.2015, 21:13 | |
|
Ответы с готовыми решениями:
7
Распознавание речи распознавание русской речи на C# Распознавание речи с использованием Speech API |
|
|
||||||||
| 13.04.2015, 10:20 | ||||||||
Сообщение было отмечено assvard как решение
Решение
NAudio.dll и SpeechToText.exe С исходным кодом - желательно иметь все файлы, кроме разве что папок bin и obj.
2
|
||||||||
|
|
||
| 13.04.2015, 10:35 | ||
|
2- чтобы не подвисало, запускайте запрос на распознавание в отдельном потоке.
1
|
||
|
0 / 0 / 0
Регистрация: 10.07.2015
Сообщений: 1
|
|||||||||||
| 11.07.2015, 05:46 | |||||||||||
|
Идея конечно не очень умная, но можно просто использовать таймер.
Выставлять интервал в зависимости от интернета, в моем случае 1000 миллисекунд достаточно. (Даже можно меньше, для повышение реакции)
0
|
|||||||||||
|
0 / 0 / 1
Регистрация: 12.11.2014
Сообщений: 118
|
|
| 09.02.2017, 00:57 | |
|
Вставил в программу онлайн распознавание от Гугл, но результатом служит пустое значение {result;}. Вопрос, работает ли еще распознавание речи через гугл API?
0
|
|
|
0 / 0 / 0
Регистрация: 20.08.2017
Сообщений: 1
|
|
| 20.08.2017, 18:18 | |
|
Если я правильно понял, то программа возвращает запрос от api в двух формфакторах: alternative - конкретно, распознанный текст и в transcript - транскрипция представляемая интерпретатором, а не проще отфильтровать полученные данные, и да, первый запрос 10-15 секунд в зависимости от качества соединения. В ближайшее время напишу код, в котором отфильтрую данные.)
0
|
|
|
0 / 0 / 0
Регистрация: 19.07.2015
Сообщений: 2
|
|
| 16.01.2018, 21:59 | |
|
Никто не знает как реализовать потоковое распознование речи?|
0
|
|
|
6 / 4 / 3
Регистрация: 23.10.2010
Сообщений: 293
|
||
| 07.09.2018, 23:28 | ||
0
|
||
| 07.09.2018, 23:28 | |
|
Помогаю со студенческими работами здесь
8
Распознавание речи в текст, Google HttpWebRequest к Google speech api Распознавание речи Google и сохранение результатов в текстовый файл Google Speech API - управление голосом Распознавание речи Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
||||
|
Thinkpad X220 Tablet — это лучший бюджетный ноутбук для учёбы, точка.
Programma_Boinc 23.12.2025
Рецензия / Мнение/ Перевод
Ниже машинный перевод статьи The Thinkpad X220 Tablet is the best budget school laptop period .
Thinkpad X220 Tablet — это лучший бюджетный ноутбук для учёбы,. . .
|
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта
Симптом:
После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
|
Как объединить две одинаковые БД Access с разными данными
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
|
Новый ноутбук
volvo 07.12.2025
Всем привет.
По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне:
Ryzen 5 7533HS
64 Gb DDR5
1Tb NVMe
16" Full HD Display
Win11 Pro
|
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
|
|
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
|
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов
На странице:
https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/
нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
|
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов.
. . .
|
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
|
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
|