|
0 / 0 / 0
Регистрация: 21.01.2022
Сообщений: 20
|
|
Выбор LLM и архитектуры для чат-бота консультанта на сайт (Open WebUI + база знаний / RAG)27.02.2026, 20:57. Показов 262. Ответов 2
Метки нет (Все метки)
Всем привет
Нужно реализовать чат-бота консультанта для сайта. Бот должен отвечать на вопросы пользователей на основе моей базы знаний (FAQ, инструкции, описания товаров и т.д.). Сейчас тестирую модели через Open WebUI уже на сервере, но не понимаю: 1. Какую модель лучше выбрать для прода и какими характеристиками должен обладать сервер? 2. Как правильно подключить базу знаний к модели (RAG, embeddings, векторная БД)? 3. Как в целом должна выглядеть архитектура такого решения? Стек сайта - PHP Хочется услышать рекомендации от тех, кто уже сталкивался с подобным: Какие модели сейчас адекватны по качеству/ресурсам для роли консультанта? Как внедрить список запрещенных слов/тем? Что использовать для embeddings? Какую векторную БД лучше взять? Как организовать пайплайн: загрузка документов -> индексация -> поиск -> генерация ответа? Есть ли нормальные примеры архитектуры для прод-решения? Бот в итоге должен отвечать строго на основе базы знаний, иначе отвечать, что менеджер займется этим вопросом.
0
|
|
| 27.02.2026, 20:57 | |
|
Ответы с готовыми решениями:
2
Шутки Агента на базе open-webui+llama-server Создание чат-бота
|
|
698 / 574 / 75
Регистрация: 20.09.2014
Сообщений: 3,725
|
|
| 27.02.2026, 21:51 | |
|
Эта отрасль слишком быстро развивается нынче, поэтому трудно посоветовать что-то конкретное.
Загуглите разницу между RAG/Fine-tuning/Prompting - это более-менее стабильная информация. Была такая статья на Хабре. Добавлено через 4 минуты Я, не зная всех подробностей, попробовал бы взять за основу API Sber GigaChat. Попинал бы эту корову.
0
|
|
|
14293 / 9378 / 1352
Регистрация: 21.01.2016
Сообщений: 35,344
|
|||
| Вчера, 09:42 | |||
|
0
|
|||
| Вчера, 09:42 | |
|
Помогаю со студенческими работами здесь
3
Выбор архитектуры нейронной сети База знаний Построение базы знаний экспертной системы Несколько баз знаний в одной экспертной системе Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
Реалии
Hrethgir 01.03.2026
Нет, я не закончил до сих пор симулятор. Эта задача сложнее. Не получилось уйти в плавсостав, но оно и к лучшему, возможно. Точнее получалось - но сварщиком в палубную команду, а это значит, в моём. . .
|
Ритм жизни
kumehtar 27.02.2026
Иногда приходится жить в ритме, где дел становится всё больше, а вовлечения в происходящее — всё меньше. Плотный график не даёт вниманию закрепиться ни на одном событии. Утро начинается с быстрых,. . .
|
SDL3 для Web (WebAssembly): Сборка SDL3 и Box2D из исходников с помощью CMake и Emscripten
8Observer8 27.02.2026
Недавно вышла версия 3. 4. 2 библиотеки SDL3. На странице официальной релиза доступны исходники, готовые DLL (для x86, x64, arm64), а также библиотеки для разработки под Android, MinGW и Visual Studio. . . .
|
SDL3 для Web (WebAssembly): Реализация движения на Box2D v3 - трение и коллизии с повёрнутыми стенами
8Observer8 20.02.2026
Содержание блога
Box2D позволяет легко создать главного героя, который не проходит сквозь стены и перемещается с заданным трением о препятствия, которые можно располагать под углом, как верхнее. . .
|
|
Конвертировать закладки radiotray-ng в m3u-плейлист
damix 19.02.2026
Это можно сделать скриптом для PowerShell. Использование
. \СonvertRadiotrayToM3U. ps1 <path_to_bookmarks. json>
Рядом с файлом bookmarks. json появится файл bookmarks. m3u с результатом.
# Check if. . .
|
Семь CDC на одном интерфейсе: 5 U[S]ARTов, 1 CAN и 1 SSI
Eddy_Em 18.02.2026
Постепенно допиливаю свою "многоинтерфейсную плату". Выглядит вот так:
https:/ / www. cyberforum. ru/ blog_attachment. php?attachmentid=11617&stc=1&d=1771445347
Основана на STM32F303RBT6.
На борту пять. . .
|
Камера Toupcam IUA500KMA
Eddy_Em 12.02.2026
Т. к. у всяких "хикроботов" слишком уж мелкий пиксель, для подсмотра в ESPriF они вообще плохо годятся: уже 14 величину можно рассмотреть еле-еле лишь на экспозициях под 3 секунды (а то и больше),. . .
|
И ясному Солнцу
zbw 12.02.2026
И ясному Солнцу,
и светлой Луне.
В мире
покоя нет
и люди
не могут жить в тишине.
А жить им немного лет.
|