|
Nekrylov_Ivan
|
|
Учим систему разговаривать!30.01.2013, 14:52. Показов 1206. Ответов 3
Метки нет (Все метки)
Здравствуйте, начну с того что я чайник каких еще поискать надо. Отойдя от вступления подойдем ближе к делу.
В некотором царстве в некотором государстве лазил я по просторам всемирной паутины, и наткнулся на интересную вещь. Так называемую как говорящий компьютер. Например все знают такой фильм как железный человек. У него был компьютер который разговаривал с ним и при помощи голосового управления наш герой управлял им. Ну и погуглив я наткнулся на такую тему http://yakim.org.ua/articles/w... buntu.html ну что же потом я посоветовался с одним из экспертов из компании freesoft.com мне он ответил: "Вы знаете, полноценных систем подобных вроде нет :-) Хотя вы можете изучить программирование и сделать подобное на основе готового движка для синтеза речи." Наш герой который я загорелся идеей и написал вот этот пост. Итак заключение что нужно для данной системы? И возможно ли такому чайнику как я что нибудь из этого сделать? Время не имеет значение!
|
|
| 30.01.2013, 14:52 | |
|
Ответы с готовыми решениями:
3
Эксплуатация, советуем, предостерегаем, учим. Учим ASP (вопросы, помощь, советы.) |
|
2924 / 1274 / 114
Регистрация: 27.05.2008
Сообщений: 3,465
|
|
| 03.02.2013, 14:09 | |
|
Если "Время не имеет значения!" - то сделать можно все. Правда, неизвестно, увидишь ли ты результат своих трудов.... или его увидят только твои правнуки?
По твоей идее: собственно программа распадается на две части: 1. преобразование текста в речь, т.н. TTS - text to speech - уже существуют достаточно удачные системы синтеза голоса. Этим занимаются фирмы Nuance, российский ЦРТ и другие. Основная проблема в синтезе русской речи по произвольному тексту - это правильная интонация и расстановка ударений. Но, по крайней мере, можно взять уже готовый "движок" и получить на выходе вполне осмысленную речь. Она будет звучать неестественно, "роботизированно", но смысл сказанного компьютером будет совершенно понятен. Реально такие системы уже широко применяются в аэропортах, вокзалах, отелях и т.п. - ты думаешь, фразу "Поезд номер двадцать шесть до Москвы отправляется с пятого пути через десять минут" произносит человек? Это - компьютерный синтез. 2. преобразование речи в текст, STT - speech to text - достаточно сложная задача. Для английского языка системы уже существуют, для русского же языка (мне, по крайней мере) такой системы, успешно распознающей произвольный текст (на русском языке) - не известны. Задача распознавания весьма сложна. (В скобках: не берем в расчет какую-либо узкоспециальную область, где весь смысл сказанного определяется терминологией; вот "обучить" компьютер распознавать узкоспециальные термины как раз можно. Проблема именно в распознавании совершенно произвольного текста....)
0
|
|
|
4694 / 2702 / 734
Регистрация: 02.08.2011
Сообщений: 7,228
|
|
| 13.02.2013, 20:59 | |
|
1. Распознавание речи
2. Осмысленная интерпретация полученного. 3. Выполнение определенных действий ( выполнение команд, поиск ответа). В любой случае понадобится огромная база знаний со своими фактами и правилами. Даже нормальные экспертные системы, предназначенные для какой-то очень узкой области, пишутся довольно долго. (год минимум, и не в одиночку). В свое время была мысль написать нечто интеллектуальное ,чтобы можно было писать программы через голосовое управление. Большой набор ключевых слов. -> Просто диктуешь исходник, а текстовый редактор тебе вбивает. Произносишь "Run Debug" или "Build", и , хоба-на, вот тебе прога. Но это слишком сложно.
0
|
|
|
2924 / 1274 / 114
Регистрация: 27.05.2008
Сообщений: 3,465
|
|
| 14.02.2013, 09:54 | |
|
IamRain, "год минимум, и не в одиночку" - это для такой задачи очень быстро. Очень.
Реально такие системы создаются большим коллективом долгими годами. Т.е. объем работы "с нуля" - десятки, если не сотни человеко-лет.
0
|
|
| 14.02.2013, 09:54 | |
|
Помогаю со студенческими работами здесь
4
Почему если ты программист, все считают, что тебе интересно только о компьютере разговаривать? Учим компьютер играть в Гомоку (пять в ряд) Учим компьютер играть в Гомоку (пять в ряд) Учим zend framework 2 в два раза быстрее Учим code::blocks компилировать gcc компилятором Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
Первый деплой
lagorue 16.01.2026
Не спеша развернул своё 1ое приложение в kubernetes.
А дальше мне интересно создать 1фронтэнд приложения и 2 бэкэнд приложения
развернуть 2 деплоя в кубере получится 2 сервиса и что-бы они. . .
|
Расчёт переходных процессов в цепи постоянного тока
igorrr37 16.01.2026
/ *
Дана цепь постоянного тока с R, L, C, k(ключ), U, E, J. Программа составляет систему уравнений по 1 и 2 законам
Кирхгофа, решает её и находит токи на L и напряжения на C в установ. режимах до и. . .
|
Восстановить юзерскрипты Greasemonkey из бэкапа браузера
damix 15.01.2026
Если восстановить из бэкапа профиль Firefox после переустановки винды, то список юзерскриптов в Greasemonkey будет пустым.
Но восстановить их можно так.
Для этого понадобится консольная утилита. . .
|
Изучаю kubernetes
lagorue 13.01.2026
А пригодятся-ли мне знания kubernetes в России?
|
|
Сукцессия микоризы: основная теория в виде двух уравнений.
anaschu 11.01.2026
https:/ / rutube. ru/ video/ 7a537f578d808e67a3c6fd818a44a5c4/
|
WordPad для Windows 11
Jel 10.01.2026
WordPad для Windows 11
— это приложение, которое восстанавливает классический текстовый редактор WordPad в операционной системе Windows 11. После того как Microsoft исключила WordPad из. . .
|
Classic Notepad for Windows 11
Jel 10.01.2026
Old Classic Notepad for Windows 11
Приложение для Windows 11, позволяющее пользователям вернуть классическую версию текстового редактора «Блокнот» из Windows 10. Программа предоставляет более. . .
|
Почему дизайн решает?
Neotwalker 09.01.2026
В современном мире, где конкуренция за внимание потребителя достигла пика, дизайн становится мощным инструментом для успеха бренда. Это не просто красивый внешний вид продукта или сайта — это. . .
|