|
1 / 1 / 3
Регистрация: 17.09.2015
Сообщений: 29
|
|
Телефонный бот09.02.2023, 09:58. Показов 1085. Ответов 9
Задача: сделать простой телефонный бот.
Преобразование аудио в текст будет реализовываться через Yandex SpeechKit. Основная проблема: как из текста выявить намерение собеседника. Простой пример: Ниже идет список фраз, которые нужно идентифицировать как "Приветствие": Здравствуйте Здрасте Здрасте, Сергей Привет Добрый день Я Вас приветствую ... Ниже идет список фраз, которые нужно идентифицировать как "Положительный", "Отрицательный", "Неуверенно положительный", "Неуверенно отрицательный" и "неопределенный" ответ на вопрос Да "Положительный" Конечно, да "Положительный" Нет "Отрицательный" Не в коем случае "Отрицательный" Скорее всего, нет "Неуверенно отрицательный" Возможно "Неуверенно положительный" Может быть "Неуверенно положительный" Не сейчас "неопределенный" ... Сейчас копаю в сторону NLP и NER. В частности разбираюсь с библиотекой Natasha. Интересуют возможные варианты решения поставленной задачи. Язык программирования не важен, важен сам концепт и инструменты для реализации подобной задачи.
0
|
|
| 09.02.2023, 09:58 | |
|
Ответы с готовыми решениями:
9
Бот Анфиса и бот Алиса хотят сыграть во что-нибудь по сети Телефонный справочник
|
|
0 / 0 / 0
Регистрация: 18.04.2019
Сообщений: 32
|
|
| 10.02.2023, 01:10 | |
|
kandiral, подключаюсь к данной теме, решаю задачу аналогичного характера еще большей сложности с извлечением переменных и алгоритмов из сложных текстов, возможно, мой опыт окажется полезен. Могу быть некорректен в терминах.
Самым топорным вариантом будет большая база всевозможных вариантов ответа + корректировка синонимов + расстояние Левенштейна. Справедливости ради, как минимум на первом проходе поиск типичных вариантов имеет смысл. Даже не самые сырые боты имеют свойство переспрашивать в духе "вы сказали [результат распознавания], это верно?" психологически вынуждая пользователя дать более простой триггер. Вот самое сложное с чем сталкивался, так это критерии ответа, ведь ответы и вовсе могут быть не в попад, и могут содержать стихотворения Пушкина, так что база ложных ответов так же имеет место быть. Это больше типично для жирных баз данных и машинного обучения. В какой-то мере это отсеивается по ключевым словам, точнее, их отсутствию, примерное содержание можно идентифицировать по шаблонам, лично я использую что-то вроде последовательностей частей речи для идентификации присвоения переменных и алгоритмов. Так или иначе, это скорее всего будет из себя представлять комплекс решений в очереди понижения надежности.
0
|
|
|
|
||||||||||||
| 10.02.2023, 13:29 | ||||||||||||
|
Воспользуемся синтаксисом пайтона: Фраза из одного слова:
Далее нужно будет разработать парсер, который такое представление слов и фраз будет переводить в конечный автомат, потому что на полном переборе всех возможных фраз бот сдохнет.
0
|
||||||||||||
|
0 / 0 / 0
Регистрация: 18.04.2019
Сообщений: 32
|
|||
| 10.02.2023, 15:49 | |||
|
Отчасти верно, но есть исключения. На мой взгляд, наибольшую проблему представляют случаи, когда форма ответа радикально отличается от ожидаемой. Но это зачастую ставит в ступор не то что конечный автомат или ИИ, но и человека.
0
|
|||
|
0 / 0 / 0
Регистрация: 18.04.2019
Сообщений: 32
|
||
| 10.02.2023, 23:24 | ||
|
0
|
||
|
0 / 0 / 0
Регистрация: 18.04.2019
Сообщений: 32
|
||
| 11.02.2023, 17:58 | ||
|
Просто любым способом перегоняем синонимы/формы слов/словосочетания в токены по типу "привет, да" или "конечно, добрый день" в токены [HELLO, YES]/[YES, HELLO] и определение таких последовательностей как триггера. Вычленить эти последовательности из контекста немного отдельная задачка. Как я понимаю, у ТС какой-то конкретный бизнес-проект, потому имеет смысл читать статистики и исследования по соответствующей теме, так можно определить самые частые ответы и даже самый простой алгоритм даст 90% точность. Нравится, не нравится, но одних навыков программирования в таком случае недостаточно. Как и одного универсального алгоритма. Потому предалагаю очередь из алгоритмов с подсчетом вероятности ошибки, начиная от описанного примитива, и заканчивая вопросом бота: "Это означает да или нет?" с перезапуском цикла, в случае высокого значения ошибки, при оценке от основных алгоритмов, что так же является рекомендацией в рамках бизнес-решения. Такой вот концепт, реализацию в мелких деталях на данный момент не обсуждаю. Где-то в стопке порядка данных алгоритмов и будет находиться более "умный" (не в отрицательном смысле) алгоритм, к которому вы склоняете. Даже если ТС удастся реализовать достаточно высокую точность - предложенные мною решения смогут подстраховать.
0
|
||
|
|
|
| 12.02.2023, 05:10 | |
|
0
|
|
| 12.02.2023, 05:10 | |
|
Помогаю со студенческими работами здесь
10
Телефонный справочник Телефонный справочник на C++
Телефонный справочник
Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
||||
|
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта
Симптом:
После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
|
Access
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
|
Новый ноутбук
volvo 07.12.2025
Всем привет.
По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне:
Ryzen 5 7533HS
64 Gb DDR5
1Tb NVMe
16" Full HD Display
Win11 Pro
|
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
|
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
|
|
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов
На странице:
https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/
нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
|
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов.
. . .
|
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
|
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
|
Создание Single Page Application на фреймах
krapotkin 16.11.2025
Статья исключительно для начинающих. Подходы оригинальностью не блещут.
В век Веб все очень привыкли к дизайну Single-Page-Application .
Быстренько разберем подход "на фреймах".
Мы делаем одну. . .
|