Форум программистов, компьютерный форум, киберфорум
ИИ, нейросети, LLM, ML, Data Science, ИИ-агенты
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
0 / 0 / 0
Регистрация: 21.01.2022
Сообщений: 20

Выбор LLM и архитектуры для чат-бота консультанта на сайт (Open WebUI + база знаний / RAG)

27.02.2026, 20:57. Показов 262. Ответов 2
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Всем привет

Нужно реализовать чат-бота консультанта для сайта.
Бот должен отвечать на вопросы пользователей на основе моей базы знаний (FAQ, инструкции, описания товаров и т.д.).

Сейчас тестирую модели через Open WebUI уже на сервере, но не понимаю:

1. Какую модель лучше выбрать для прода и какими характеристиками должен обладать сервер?
2. Как правильно подключить базу знаний к модели (RAG, embeddings, векторная БД)?
3. Как в целом должна выглядеть архитектура такого решения?

Стек сайта - PHP

Хочется услышать рекомендации от тех, кто уже сталкивался с подобным:

Какие модели сейчас адекватны по качеству/ресурсам для роли консультанта?
Как внедрить список запрещенных слов/тем?
Что использовать для embeddings?
Какую векторную БД лучше взять?
Как организовать пайплайн: загрузка документов -> индексация -> поиск -> генерация ответа?
Есть ли нормальные примеры архитектуры для прод-решения?

Бот в итоге должен отвечать строго на основе базы знаний, иначе отвечать, что менеджер займется этим вопросом.
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
27.02.2026, 20:57
Ответы с готовыми решениями:

Шутки Агента на базе open-webui+llama-server
Заинтересовался работой агентов, использующих LLM и позволяющих различные действия: анализ текстов,...

Создание чат-бота
Здраствуйте!Хочу начать изучать чат-ботов и создать своего.Может кто подробно рассказать про...

Как создаются нейросети для чат ботов?
Хочу узнать как создаются нейросети для чат-ботов. неужеле нужна какая-то супер математика?

2
698 / 574 / 75
Регистрация: 20.09.2014
Сообщений: 3,725
27.02.2026, 21:51
Эта отрасль слишком быстро развивается нынче, поэтому трудно посоветовать что-то конкретное.
Загуглите разницу между RAG/Fine-tuning/Prompting - это более-менее стабильная информация. Была такая статья на Хабре.

Добавлено через 4 минуты
Я, не зная всех подробностей, попробовал бы взять за основу API Sber GigaChat. Попинал бы эту корову.
0
Эксперт .NET
 Аватар для Usaga
14293 / 9378 / 1352
Регистрация: 21.01.2016
Сообщений: 35,344
Вчера, 09:42
Цитата Сообщение от iugoia Посмотреть сообщение
1. Какую модель лучше выбрать для прода и какими характеристиками должен обладать сервер?
Только купить подписку на API YandexGTP, Sber GigaChat, Qwen, DeepSeek или иных персонажей, что с РФ ещё сотрудничают. Сервер, подходящий для инференса таких моделей ты не сможешь себе позволить, да если все органы свои продашь (не шутка).

Цитата Сообщение от iugoia Посмотреть сообщение
2. Как правильно подключить базу знаний к модели (RAG, embeddings, векторная БД)?
Почитай, что есть RAG.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
Вчера, 09:42
Помогаю со студенческими работами здесь

Ключевые слова для чат-бота
Здесь я решил посмотреть на проблему чат бота с другой стороны. И мне очень важно ваше мнение. Не...

Выбор архитектуры нейронной сети
У меня имеется два временных ряда, причём таких, что значения в одном ряде некоторым очень сложным...

База знаний
Создаю базу знаний. Хотелось бы пообщаться с людьми, которые ведут разработки в этом направлении.

Построение базы знаний экспертной системы
помогите пожалуйста! Построение базы знаний экспертной системы на основе продукционной модели...

Несколько баз знаний в одной экспертной системе
Добрый день, в рамках дипломной работы мне нужно сравнить семантическую и продукционную базу знаний...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
3
Ответ Создать тему
Новые блоги и статьи
Реалии
Hrethgir 01.03.2026
Нет, я не закончил до сих пор симулятор. Эта задача сложнее. Не получилось уйти в плавсостав, но оно и к лучшему, возможно. Точнее получалось - но сварщиком в палубную команду, а это значит, в моём. . .
Ритм жизни
kumehtar 27.02.2026
Иногда приходится жить в ритме, где дел становится всё больше, а вовлечения в происходящее — всё меньше. Плотный график не даёт вниманию закрепиться ни на одном событии. Утро начинается с быстрых,. . .
SDL3 для Web (WebAssembly): Сборка SDL3 и Box2D из исходников с помощью CMake и Emscripten
8Observer8 27.02.2026
Недавно вышла версия 3. 4. 2 библиотеки SDL3. На странице официальной релиза доступны исходники, готовые DLL (для x86, x64, arm64), а также библиотеки для разработки под Android, MinGW и Visual Studio. . . .
SDL3 для Web (WebAssembly): Реализация движения на Box2D v3 - трение и коллизии с повёрнутыми стенами
8Observer8 20.02.2026
Содержание блога Box2D позволяет легко создать главного героя, который не проходит сквозь стены и перемещается с заданным трением о препятствия, которые можно располагать под углом, как верхнее. . .
Конвертировать закладки radiotray-ng в m3u-плейлист
damix 19.02.2026
Это можно сделать скриптом для PowerShell. Использование . \СonvertRadiotrayToM3U. ps1 <path_to_bookmarks. json> Рядом с файлом bookmarks. json появится файл bookmarks. m3u с результатом. # Check if. . .
Семь CDC на одном интерфейсе: 5 U[S]ARTов, 1 CAN и 1 SSI
Eddy_Em 18.02.2026
Постепенно допиливаю свою "многоинтерфейсную плату". Выглядит вот так: https:/ / www. cyberforum. ru/ blog_attachment. php?attachmentid=11617&stc=1&d=1771445347 Основана на STM32F303RBT6. На борту пять. . .
Камера Toupcam IUA500KMA
Eddy_Em 12.02.2026
Т. к. у всяких "хикроботов" слишком уж мелкий пиксель, для подсмотра в ESPriF они вообще плохо годятся: уже 14 величину можно рассмотреть еле-еле лишь на экспозициях под 3 секунды (а то и больше),. . .
И ясному Солнцу
zbw 12.02.2026
И ясному Солнцу, и светлой Луне. В мире покоя нет и люди не могут жить в тишине. А жить им немного лет.
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru