|
99 / 100 / 16
Регистрация: 30.03.2011
Сообщений: 350
|
||||||
NAudio Как с помощью этой библиотеки работать c mp3 файлами?08.04.2011, 20:04. Показов 11097. Ответов 13
Метки нет (Все метки)
Как с помощью этой библиотеки работать c mp3 файлами? получаю фреймы с данными RawData, так
Может ли ктонибудь поделиться ссылкой - как использовать методы FFT библиотеки NAudio? Добавлено через 46 минут А чтобы например сравнить звук с микрофона с темже mp3, какими форматом должен обладать файл? Тоесть какова должна быть его частота, биты, каналов? И нужно ли проводить какую нибудь нормализацию исходных данных и микрофонных? Собираюсь использовать следующюю схему сравнения: 1) для исходника - Массив отсчетов->БПФ->MFCC 2)для микрофонных данных - Массив отсчетов->БПФ->И также MFCC Потом через TDW их стравнить. Правильно ли я понял алгоритм?
0
|
||||||
| 08.04.2011, 20:04 | |
|
Ответы с готовыми решениями:
13
Как работать с текстовыми файлами с помощью VBScript в ASP? Пропали эскизы папок с mp3 файлами, отсутствуют теги в mp3 файлах Бывает ли функция, с помощью которой можно работать со всеми файлами определённого формата? |
|
87 / 85 / 10
Регистрация: 04.04.2011
Сообщений: 221
|
|
| 08.04.2011, 20:05 | |
|
http://www.codeproject.com/KB/... sharp.aspx
А еще, говорят полезно освоить такой сложный инструмент, как Гугл - в работе очень помогает ![]() http://naudio.codeplex.com/documentation
0
|
|
|
_
2364 / 1243 / 78
Регистрация: 28.10.2009
Сообщений: 4,331
|
||
| 08.04.2011, 20:17 | ||
![]() (Вместо TDW можно использовать СММ и нейронные сети, а вместо БПФ вейвлет-преобразования)
0
|
||
|
99 / 100 / 16
Регистрация: 30.03.2011
Сообщений: 350
|
|||
| 08.04.2011, 20:33 [ТС] | |||
|
А что насчет нормализации, ее нужно делать? 16 битные данные нужно использовать, один канал, насчет частоты не знаю, правльно понял? или можно с двухканальными данными работать(объеденив их или используя один какойнить канал)
0
|
|||
|
_
2364 / 1243 / 78
Регистрация: 28.10.2009
Сообщений: 4,331
|
|
| 08.04.2011, 20:43 | |
|
Не знаю, у каждого метода есть плюсы и минусы, причем в эту цепочку добавляют различные преобразования - типа окна Хемминга или Ханна, логарифмическое преобразование, нормализация и т.д., вместо MFCC иногда используют LPC, плюс используют еще нейронные сети, а если брать пофонемное сравнение - то есть методы, где все предыдущее вообще не употребляется. Вообщем однозначно правильных алгоритмов нет - полный простор для творчества.
Я уж не говорю, что есть куча реализаций для того же БПФ - а какой оптимальный - неизвестно - это надо испытывать, пробовать.
1
|
|
|
99 / 100 / 16
Регистрация: 30.03.2011
Сообщений: 350
|
||
| 08.04.2011, 20:50 [ТС] | ||
|
А можно ли mp3 файл преобразовать в wavestream с 1 каналом и потом использовать его, а то непонятно как работать с фреймами и joinstereo mp3 файла, или это уже извращением является?
0
|
||
|
_
2364 / 1243 / 78
Регистрация: 28.10.2009
Сообщений: 4,331
|
|
| 08.04.2011, 21:00 | |
|
окно Хемминга/Ханна используются над массивом отсчетов - нередко одновременно с БПФ, нормализация вроде тоже над массивом отсчетов, но не уверен. логарифмич. преобразование вроде уже после БПФ. Почитай спец. лит-ру.
Только я не знаю, насколько эффективен будет анализ данных из mp3, с wav и с потоком от микрофона вроде проще.
0
|
|
|
99 / 100 / 16
Регистрация: 30.03.2011
Сообщений: 350
|
||||||
| 08.04.2011, 21:05 [ТС] | ||||||
|
в исходниках примера Naudio есть строки переводящие из массива байт во float
0
|
||||||
|
_
2364 / 1243 / 78
Регистрация: 28.10.2009
Сообщений: 4,331
|
|
| 08.04.2011, 21:10 | |
|
Программа получает с микрофона каждые 10 мс буфер 1600 байт и в этом коде из двух байт создается один экземпляр short, затем посредством деления он переводится во float
0
|
|
|
99 / 100 / 16
Регистрация: 30.03.2011
Сообщений: 350
|
||
| 08.04.2011, 21:39 [ТС] | ||
|
А откуда вязлось число 32768f? Чтобы сравнить тодже например файл wav размера 20мб и длительностью 3 мин, с куском данных( 10 сек) с микрофона, как нужно обрабатывать файл аудио(тоесть его весь через фурье пропускать, а потом сравнивать с куском двигаясь с шагом, или както подругому это делают)?
Добавлено через 24 минуты
0
|
||
|
_
2364 / 1243 / 78
Регистрация: 28.10.2009
Сообщений: 4,331
|
|
| 08.04.2011, 21:51 | |
|
nuke4303, 32768 - это максимальное значение short, поэтому его используют для получения float.
По обработке не подскажу - БПФ не приходилось делать. Но в бпф могут использоваться буферы кратностью два - то есть весь файл не засунуть. Лучше обратись к первоисточникам - погугли FFT, MFCC и т.д.
0
|
|
|
99 / 100 / 16
Регистрация: 30.03.2011
Сообщений: 350
|
|||
| 08.04.2011, 21:58 [ТС] | |||
|
0
|
|||
|
_
2364 / 1243 / 78
Регистрация: 28.10.2009
Сообщений: 4,331
|
|
| 08.04.2011, 22:03 | |
|
Ну да типа 1024 или 8192. Почему так - не помню, как то в теории не особо разбирался
1
|
|
|
99 / 100 / 16
Регистрация: 30.03.2011
Сообщений: 350
|
|
| 09.04.2011, 20:06 [ТС] | |
|
а может ктонибудь подсказать\дать ссылку где можно почитать хорошую литературу про алгоритмы MFCC DTW др
Добавлено через 2 часа 58 минут Аесли сипользовать FFTW, то туда можно передать массив любого размера? Добавлено через 18 часов 28 минут А если имееются музыкальный файл, и файл записанный с микрофона(с куском музыки). Какими способами можно сравнить эти файлы, для опреленения входит ли фрагмент с микрофона в мцзыкальный файл. Часто используют связку типа - Массив отсчетов->БПФ->MFCC->DTW(нейросеть) для двух файлов. Но в основном исходя из форумов, эту связку используют для распознавания голоса. Приминима ли эта связка преобразоваий к музыкальным файлам? И каким образом обрабатывать музыкальные файла длительностью напрмиер 4минуты и сравнивать их с куском микрофонным например 10 секундным?, если создавать эталон по музыкальному файлу весь его разложив в фурье и тд, то он выйдет достаточно большим.
0
|
|
| 09.04.2011, 20:06 | |
|
Помогаю со студенческими работами здесь
14
Добавление библиотеки NAudio в UWP проект Как проиграть mp3 с помощью VC++? Запись звука в byte[] с помощью NAudio Воспроизведение Wave файла с помощью NAudio Создание dll библиотеки в C#. Вызов классов этой библиотеки Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
Оттенки серого
Argus19 18.03.2026
Оттенки серого
Нашёл в интернете 3 прекрасных модуля:
Модуль класса открытия диалога открытия/ сохранения файла на Win32 API;
Модуль класса быстрого перекодирования цветного изображения в оттенки. . .
|
SDL3 для Desktop (MinGW): Рисуем цветные прямоугольники с помощью рисовальщика SDL3 на Си и C++
8Observer8 17.03.2026
Содержание блога
Финальные проекты на Си и на C++:
finish-rectangles-sdl3-c. zip
finish-rectangles-sdl3-cpp. zip
|
Символические и жёсткие ссылки в Linux.
algri14 15.03.2026
Существует два типа ссылок — символические и жёсткие.
Ссылка в Linux — это запись в каталоге, которая может указывать либо на inode «файла-ИСТОЧНИКА», тогда это будет «жёсткая ссылка» (hard link),. . .
|
[Owen Logic] Поддержание уровня воды в резервуаре количеством включённых насосов: моделирование и выбор регулятора
ФедосеевПавел 14.03.2026
Поддержание уровня воды в резервуаре количеством включённых насосов: моделирование и выбор регулятора
ВВЕДЕНИЕ
Выполняя задание на управление насосной группой заполнения резервуара,. . .
|
|
делаю науч статью по влиянию грибов на сукцессию
anaschu 13.03.2026
прикрепляю статью
|
SDL3 для Desktop (MinGW): Создаём пустое окно с нуля для 2D-графики на SDL3, Си и C++
8Observer8 10.03.2026
Содержание блога
Финальные проекты на Си и на C++:
hello-sdl3-c. zip
hello-sdl3-cpp. zip
Результат:
|
Установка CMake и MinGW 13.1 для сборки С и C++ приложений из консоли и из Qt Creator в EXE
8Observer8 10.03.2026
Содержание блога
MinGW - это коллекция инструментов для сборки приложений в EXE. CMake - это система сборки приложений. Здесь описаны базовые шаги для старта программирования с помощью CMake и. . .
|
Как дизайн сайта влияет на конверсию: 7 решений, которые реально повышают заявки
Neotwalker 08.03.2026
Многие до сих пор воспринимают дизайн сайта как “красивую оболочку”. На практике всё иначе: дизайн напрямую влияет на то, оставит человек заявку или уйдёт через несколько секунд.
Даже если у вас. . .
|