|
0 / 0 / 0
Регистрация: 16.01.2011
Сообщений: 3
|
|
Алгоритм выделения формант речи16.01.2011, 19:44. Показов 14924. Ответов 13
Метки нет (Все метки)
Добрый день!
Вопрос к знатокам... так как мне совсем сложно в этой теме.... :'( Задача : обработка речевого сигнала...для выделения получения формант (чтобы провести анализ полученных данных на основе заданных критериев, например, определение людей с некоторыми заболеваниями) Сделано: 1. Описано схема устройства - микрофон - полосные фильтры - АЦП - Анализ данных 2.обоснован выбор кепстрального анализа 3. реализация вычисление кепстра ДПФ - Log - обратное ДПФ В итоге с кепстра нужно выделить форманты с помощью некоторого алгоритма, вот тут у меня полный ступор... ![]() Никакой инфы найти не могу... кроме книги : Рабинера - Цифровая обработка речевых сигналов (там непонятно описано) Если, есть возможность скиньте ссылки на рускоязычные источники, с описанием алгоритма (блок-схемы)... Спасибо заранее огромное.
0
|
|
| 16.01.2011, 19:44 | |
|
Ответы с готовыми решениями:
13
Алгоритм генерации речи Алгоритм выделения динамической памяти Алгоритм выделения фрагмента текста в редакторе |
|
2014 / 1286 / 61
Регистрация: 05.06.2010
Сообщений: 2,213
|
|||
| 19.01.2011, 14:48 | |||
|
Добавлено через 3 минуты забыл сказать - форманты вычислять можно тока на вокализированных участках, а на границах тон/шум будут дополнительные проблемы которые тоже надо будет учесть
2
|
|||
|
0 / 0 / 0
Регистрация: 16.01.2011
Сообщений: 3
|
|
| 04.02.2011, 23:49 [ТС] | |
|
Спасибо за ответ. То есть вы считаете в данном случае применение кепстрального анализа справедливым?(для определения формант)? И лучшим методом - метод линейного предсказания...
А если применять простой спектральный анализ...? Мы кепстральный анализ уже переиграли на обычный спектральный. А алгоритм определения формант применяем описанный ниже... Но это мне кажется притянутым за уши, т.к. не учитывает допустим вариант с формантами буквы "И", когда вторая форманта в несколько раз больше первой...а не в 2. Сам шаг поиска формант...определяемый как равный первой форманте мне кажется не совсем верным....Непонятно как определить окно поиска формант (пока определяем как полшага назад и полшага вперед для предпологаемой форманнты). Вообщем, может быть вы подскажите более простой-действенный способ определения формант? Спектральный анализ не аксиома... "Известно, что первая форманта (частота основного тона) лежит в промежутке от 50 Гц (у взрослого мужчины) до 300 Гц ( у детей и некоторых женщин). Кроме того известно, что амплитуда каждой последующей форманты ниже, чем предыдущей, а их частоты равны частоте основного тона умноженного на целое число (2 для F1, 3 для F2 и так далее). Таким образом мы можем найти максимальное значение амплитуды сигнала на отрезке от 50 Гц до 300 Гц, после чего умножить эту частоту на 2, найти максимальное значение амплитуды в некоторой окрестности этой точки, проверить является ли она максимумом амплитуды в некоторой большей окрестности. Если это предположение верно, то мы нашли частоту второй форманты (F1). Если нет – второй форманты у сигнала нет. Далее умножаем частоту основного тона на три и повторяем все вышеприведенные шаги для третьей форманты. Потом повторяем для всех остальных формант. Как правило, вычисляют от 4 до 6 формант." Кас. определения людей с заболеваниями...это как вариант развития работы...пока такой задачи не поставлено... Учучь в техническом вузе.
0
|
|
|
2014 / 1286 / 61
Регистрация: 05.06.2010
Сообщений: 2,213
|
||||||||
| 07.02.2011, 14:28 | ||||||||
Сообщение было отмечено как решение
РешениеВот набросал в матлабе код для определения формант с помощью кепстра - получилось довольно наглядно
З.Ы. По поводу линейного предсказания могу посоветовать хорошую книгу - Маркел Грэй "Линейное предсказание речи"
3
|
||||||||
|
0 / 0 / 0
Регистрация: 16.01.2011
Сообщений: 3
|
|
| 26.02.2011, 17:37 [ТС] | |
|
Спасибо за ответ. Загрузила код в матлаб...Возникло несколько вопросов:
1.Не все звуки корректно обрабатываются - программа пишет: ??? Индекс за границами матрицы. 2. При обработке слова "Крестик" ( ввиде сигнала в формате *.wav) - программа вывела только 3 форманты, хотя их естественно должно быть больше (подскажите в чем ошибка)? Может быть я ошибаюсь? Прикладываю звуковой файлы... 02.wav - слово крестик 31.wav - тот который выдает ошибку спасибо
0
|
|
|
2014 / 1286 / 61
Регистрация: 05.06.2010
Сообщений: 2,213
|
|||||
| 27.02.2011, 15:39 | |||||
|
Добавлено через 4 часа 11 минут очень советую посмотреть програмку Sfs http://www.phon.ucl.ac.uk/resource/sfs/ можно провести формантный анализ речевого сигнала и сравнить со своими результатами
1
|
|||||
|
0 / 0 / 0
Регистрация: 28.02.2013
Сообщений: 15
|
|
| 01.04.2013, 21:28 | |
|
А есть какие нибудь методики, госты определения формант?
0
|
|
|
|
|
| 01.04.2013, 22:00 | |
|
0
|
|
|
2014 / 1286 / 61
Регистрация: 05.06.2010
Сообщений: 2,213
|
||
| 02.04.2013, 09:32 | ||
. Но какая длительность этих звуков, какие у них скорости изменения, зависит не только от диктора, но и от других факторов, типа его эмоционального состояния. Ведь вы можете пытаться говорить максимально разборчиво, или наоборот торопясь и сбиваясь. Так что какие тут могут быть госты? Только ваши предпочтения, например: определяете форманты на отрезке длиной 10, 15, 20 мс, точнее первую форманту(основной тон). Далее по частоте основного тона выбираете остальные форманты в окрестности кратных частот(как - опять же исходя из ваших предпочтений)
1
|
||
|
0 / 0 / 0
Регистрация: 28.02.2013
Сообщений: 15
|
|
| 04.04.2013, 07:14 | |
|
Vital792, я пишу диплом. И вот по реверберации я нашёл чёткую методику расчёта, на которую можно будет сослаться. А вот по разборчивости придётся видимо самому писать.
0
|
|
|
2014 / 1286 / 61
Регистрация: 05.06.2010
Сообщений: 2,213
|
|
| 04.04.2013, 09:44 | |
|
Можно в вышеприведенной книге Рабинера найти рекомендации по расчету формант и сослаться на нее.
raxp, неплохо бы добавить эту книгу в закрепленную тему - хорошая книжка, хоть и старая
1
|
|
|
0 / 0 / 0
Регистрация: 28.02.2013
Сообщений: 15
|
|
| 04.04.2013, 11:13 | |
|
Vital792, Спасибо большое. Отличная книжка.
0
|
|
|
2014 / 1286 / 61
Регистрация: 05.06.2010
Сообщений: 2,213
|
|
| 04.04.2013, 11:20 | |
|
AndreyShaD, кстати, еще из литературы могу порекомендовать отличную книгу Сапожков "Вокодерная связь" и Маркел-Грей "Линейное предсказание речи". В последней есть глава описывающая исследование формантных траекторий методом линейного предсказание и сравнение его с методом кепстрального сглаживания(которое я использовал в коде на матлаб выше). Если не найдете в сети(хотя вроде должны) обращайтесь, скину на почту(на форум из-за ограничений по размеру прикрепить скорее всего не удастся)
1
|
|
|
0 / 0 / 0
Регистрация: 28.02.2013
Сообщений: 15
|
|
| 04.04.2013, 11:32 | |
|
Может есть у кого нибудь книжка в электронной версии?
Акустическая экспертиза каналов речевой коммуникации. Монография / Дидковский В. С., Дидковская М. В., Продеус А. Н.
0
|
|
| 04.04.2013, 11:32 | |
|
Помогаю со студенческими работами здесь
14
Выделить формант *.wav файла Алгоритм выделения объектов из BMP 1bit файла Алгоритм выделения прямоугольников диаграмм Вейча-Карно Запись речи, отправка файла на Google, получение текста речи Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
||||
|
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта
Симптом:
После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
|
Access
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
|
Новый ноутбук
volvo 07.12.2025
Всем привет.
По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне:
Ryzen 5 7533HS
64 Gb DDR5
1Tb NVMe
16" Full HD Display
Win11 Pro
|
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
|
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
|
|
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов
На странице:
https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/
нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
|
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов.
. . .
|
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
|
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
|
Создание Single Page Application на фреймах
krapotkin 16.11.2025
Статья исключительно для начинающих. Подходы оригинальностью не блещут.
В век Веб все очень привыкли к дизайну Single-Page-Application .
Быстренько разберем подход "на фреймах".
Мы делаем одну. . .
|