|
71 / 59 / 14
Регистрация: 20.12.2013
Сообщений: 732
|
|
Поиск разговорных выражений10.02.2026, 22:58. Показов 1285. Ответов 25
Метки нет (Все метки)
Здравствуйте.
Решил посмотреть немного пайтон. Но просто читать не особо интересно, да и почти бесполезно. Подскажите, пожалуйста, а возможно ли в пайтон сделать программу для поиска устойчивых выражений? Может подскажете какие библиотеки, какая теория? Вообще какую идею можно заложить, и можно ли вообще? Т.е. вот есть текст, найти не через поиск в строках, а именно по смыслу выражения типа "семь раз отмерь-один раз отрежь", "как слон в посудной лавке". Т.е. выражения, которые формально в тексте вообще ни к месту, в них вообще как будто говорится о вещах не из контекста, а реальный смысл не прямой. Это видимо нейросети можно попробовать, но по примерам (которые тем более пока слабо понимаю) не ясно в принципе как можно организовать.
0
|
|
| 10.02.2026, 22:58 | |
|
Ответы с готовыми решениями:
25
|
|
121 / 116 / 18
Регистрация: 05.08.2021
Сообщений: 505
|
|
| 11.02.2026, 05:47 | |
|
В Питоне есть библиотеки просто для морфологического анализа текста, в том числе разработанные в Яндексе (что и не удивительно, вещь важная для обработки поисковых запросов). А вот так чтобы "как будто говорится о вещах не из контекста" - это что-то слишком мудренное...
0
|
|
|
14299 / 9384 / 1353
Регистрация: 21.01.2016
Сообщений: 35,380
|
|
| 11.02.2026, 06:22 | |
|
AndrSlav, поднять локальную модельку через
llama.cpp, обратиться к ней через OpenAI-совместимую библиотеку (можно напрямую, но нафига?), получить ответ.
0
|
|
|
71 / 59 / 14
Регистрация: 20.12.2013
Сообщений: 732
|
|
| 11.02.2026, 10:44 [ТС] | |
|
В смысле как если бы написал запрос в чат гпт, но просто не вручную? Интересно бы было самому написать, хоть в каком-то базовом варианте. Наверно чтобы найти все выражения - это много данных надо и большая модель. Просто подумал может как-то в примитивном виде можно сделать модельку самому.
0
|
|
|
Супер-модератор
|
||
| 11.02.2026, 15:01 | ||
|
0
|
||
|
71 / 59 / 14
Регистрация: 20.12.2013
Сообщений: 732
|
||
| 11.02.2026, 17:01 [ТС] | ||
|
А насчет языка - я пайтон вообще почти не знаю. Просто в нем много библиотек, а я более чем уверен, что по теме нейросети надо использовать. Но хотелось бы конкретики, вдруг у кого-то опыт был.
0
|
||
|
14299 / 9384 / 1353
Регистрация: 21.01.2016
Сообщений: 35,380
|
||||
| 12.02.2026, 06:22 | ||||
|
Добавлено через 19 минут Единственное, что тут можно сделать - собрать набор таких выражений и проверять каждое входное предложение на нечёткое совпадение с одним из набора. Нейронка так и будет делать, по сути, сравнивая текст с учебными материалами, которая она видела и где рядом было "идиома" или "устойчивое выражение".
0
|
||||
|
71 / 59 / 14
Регистрация: 20.12.2013
Сообщений: 732
|
|
| 12.02.2026, 08:39 [ТС] | |
|
В принципе думал как-то по контексту, типа если текст о мебели, и вдруг слон упоминается, то это кандидат. Это и ошибочно может быть, и многие выражения не попадутся, но хоть как-то. Только это видимо или сложно, или никак(
0
|
|
|
14299 / 9384 / 1353
Регистрация: 21.01.2016
Сообщений: 35,380
|
|
| 12.02.2026, 08:43 | |
|
AndrSlav, это звучит как поход неизвестно куда, в поисках неизвестно чего.
Результат будет соответствующий.
0
|
|
|
71 / 59 / 14
Регистрация: 20.12.2013
Сообщений: 732
|
||
| 12.02.2026, 08:50 [ТС] | ||
|
Проблемы с тем чтобы придумать задачу, и чтобы по силам. Из данных у меня найдутся электронные книги, вот думаю какую задачу поставить для нейросети.
0
|
||
|
1712 / 579 / 76
Регистрация: 10.04.2009
Сообщений: 9,327
|
|
| 12.02.2026, 11:00 | |
|
я почти уверен, что идиомы, аллегории, поговорки, пословицы, фразеологизмы можно искать в тексте с помощью библиотеки, какой не знаю)) - не было такой задачи - инет, ИИ в помощь))
0
|
|
|
14299 / 9384 / 1353
Регистрация: 21.01.2016
Сообщений: 35,380
|
|
| 12.02.2026, 11:02 | |
|
0
|
|
|
71 / 59 / 14
Регистрация: 20.12.2013
Сообщений: 732
|
||
| 12.02.2026, 11:38 [ТС] | ||
|
Я просто сейчас не вижу что бы вообще полезного для себя сделать с помощью нейросетей. Вот эту задачу запросами к гпт, но это просто практика использования апи. Примеры в мануалах - генерация текста, классификация - это для личного пользования не нужно. Перевод на другие языки - там вообще данные специальные нужны. Вот что бы придумать чтобы самому утилиту использовать...
0
|
||
|
1712 / 579 / 76
Регистрация: 10.04.2009
Сообщений: 9,327
|
|
| 12.02.2026, 11:42 | |
|
0
|
|
|
14299 / 9384 / 1353
Регистрация: 21.01.2016
Сообщений: 35,380
|
|||
| 12.02.2026, 11:44 | |||
|
0
|
|||
|
71 / 59 / 14
Регистрация: 20.12.2013
Сообщений: 732
|
|||
| 12.02.2026, 11:50 [ТС] | |||
|
Добавлено через 1 минуту
0
|
|||
|
14299 / 9384 / 1353
Регистрация: 21.01.2016
Сообщений: 35,380
|
|
| 12.02.2026, 15:18 | |
|
AndrSlav, все-таки надо разграничивать возможности своей компетенции. Если хочется научиться, то надо браться за вещи по-проще. Особенно учитывая, что тема ИИ весьма сложная. И уже потом браться за интересные задачи)
0
|
|
|
71 / 59 / 14
Регистрация: 20.12.2013
Сообщений: 732
|
|
| 12.02.2026, 16:44 [ТС] | |
|
Не ну хочется чего-то конкретного.
Я нейросети только на pytorch полистал. Ок, с нуля пока не буду писать стараться. Я с предобученными сетями тоже дел не имел. Я правильно понимаю, что есть много предобученных сетей бесплатных, и их можно попробовать доучивать для своих задач (или даже не доучивать)? Просто не чувствую - какие-то вижу и слегка посмотрел чисто выделить лексемы, т.е. несложные функции. Т.е. бесплатные тоже стоит смотреть, или они шлак с минимальным функционалом, чисто посмотреть интерфейс, а использовать только платные приходится (пару раз чат гпт пытался в браузере использовать а он везде деньги просил)? Создалось впечатление, что и бесплатные вполне норм, но уточнить хочу, хочется сегодня определиться куда мне дальше смотреть-то.
0
|
|
|
14299 / 9384 / 1353
Регистрация: 21.01.2016
Сообщений: 35,380
|
||
| 13.02.2026, 07:51 | ||
|
0
|
||
|
6221 / 2919 / 1046
Регистрация: 01.06.2021
Сообщений: 10,813
|
||
| 13.02.2026, 22:53 | ||
|
Usaga, от локальных моделек малого размера толку мало, особенно, для русского языка. Даже моделей 14B будет недостаточно. А большие модели требуют очень много памяти.
0
|
||
| 13.02.2026, 22:53 | |
|
Помогаю со студенческими работами здесь
20
Регулярные выражения: поиск английских предложений среди русских Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
Как дизайн сайта влияет на конверсию: 7 решений, которые реально повышают заявки
Neotwalker 08.03.2026
Многие до сих пор воспринимают дизайн сайта как “красивую оболочку”. На практике всё иначе: дизайн напрямую влияет на то, оставит человек заявку или уйдёт через несколько секунд.
Даже если у вас. . .
|
Модульная разработка через nuget packages
DevAlt 07.03.2026
Сложившийся в . Net-среде способ разработки чаще всего предполагает
монорепозиторий в котором находятся все исходники.
При создании нового решения, мы просто добавляем нужные проекты
и имеем. . .
|
Модульный подход на примере F#
DevAlt 06.03.2026
В блоге дяди Боба наткнулся на такое определение:
В этой книге («Подход, основанный на вариантах использования») Ивар утверждает,
что архитектура программного обеспечения — это
структуры,. . .
|
Управление камерой с помощью скрипта OrbitControls.js на Three.js: Вращение, зум и панорамирование
8Observer8 05.03.2026
Содержание блога
Финальная демка в браузере работает на Desktop и мобильных браузерах. Итоговый код: orbit-controls-threejs-js. zip. Сканируйте QR-код на мобильном. Вращайте камеру одним пальцем,. . .
|
|
SDL3 для Web (WebAssembly): Синхронизация спрайтов SDL3 и тел Box2D
8Observer8 04.03.2026
Содержание блога
Финальная демка в браузере. Итоговый код: finish-sync-physics-sprites-sdl3-c. zip
На первой гифке отладочные линии отключены, а на второй включены:. . .
|
SDL3 для Web (WebAssembly): Идентификация объектов на Box2D v3 - использование userData и событий коллизий
8Observer8 02.03.2026
Содержание блога
Финальная демка в браузере. Итоговый код: finish-collision-events-sdl3-c. zip Сканируйте QR-код на мобильном и вы увидите, что появится джойстик для управления главным героем.
. . .
|
Реалии
Hrethgir 01.03.2026
Нет, я не закончил до сих пор симулятор. Эта задача сложнее. Не получилось уйти в плавсостав, но оно и к лучшему, возможно. Точнее получалось - но сварщиком в палубную команду, а это значит, в моём. . .
|
Ритм жизни
kumehtar 27.02.2026
Иногда приходится жить в ритме, где дел становится всё больше, а вовлечения в происходящее — всё меньше. Плотный график не даёт вниманию закрепиться ни на одном событии. Утро начинается с быстрых,. . .
|