Форум программистов, компьютерный форум, киберфорум
Python для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
 
71 / 59 / 14
Регистрация: 20.12.2013
Сообщений: 732

Поиск разговорных выражений

10.02.2026, 22:58. Показов 1285. Ответов 25
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Здравствуйте.
Решил посмотреть немного пайтон. Но просто читать не особо интересно, да и почти бесполезно.
Подскажите, пожалуйста, а возможно ли в пайтон сделать программу для поиска устойчивых выражений? Может подскажете какие библиотеки, какая теория? Вообще какую идею можно заложить, и можно ли вообще?

Т.е. вот есть текст, найти не через поиск в строках, а именно по смыслу выражения типа "семь раз отмерь-один раз отрежь", "как слон в посудной лавке".
Т.е. выражения, которые формально в тексте вообще ни к месту, в них вообще как будто говорится о вещах не из контекста, а реальный смысл не прямой.

Это видимо нейросети можно попробовать, но по примерам (которые тем более пока слабо понимаю) не ясно в принципе как можно организовать.
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
10.02.2026, 22:58
Ответы с готовыми решениями:

Поиск повторяющихся друг за другом слов с использованием регулярных выражений
Дан следующий текст: 'hello world hello hello hello world worldhellohellohello' Какое должно...

Дано выражение вида "а x b", а и b - натуральные числа, x - сравнения, Истинно ли данное выражение?
Формат входных данных: В первой строке число а, во второй знак сравнения, в третьей - число b. Оба...

Задачи на регулярные выражения - поиск количества слов
Слово — это последовательность из букв (русских или английских), внутри которой могут быть дефисы....

25
121 / 116 / 18
Регистрация: 05.08.2021
Сообщений: 505
11.02.2026, 05:47
В Питоне есть библиотеки просто для морфологического анализа текста, в том числе разработанные в Яндексе (что и не удивительно, вещь важная для обработки поисковых запросов). А вот так чтобы "как будто говорится о вещах не из контекста" - это что-то слишком мудренное...
0
Эксперт .NET
 Аватар для Usaga
14299 / 9384 / 1353
Регистрация: 21.01.2016
Сообщений: 35,380
11.02.2026, 06:22
AndrSlav, поднять локальную модельку через llama.cpp, обратиться к ней через OpenAI-совместимую библиотеку (можно напрямую, но нафига?), получить ответ.
0
71 / 59 / 14
Регистрация: 20.12.2013
Сообщений: 732
11.02.2026, 10:44  [ТС]
В смысле как если бы написал запрос в чат гпт, но просто не вручную? Интересно бы было самому написать, хоть в каком-то базовом варианте. Наверно чтобы найти все выражения - это много данных надо и большая модель. Просто подумал может как-то в примитивном виде можно сделать модельку самому.
0
Супер-модератор
Эксперт функциональных языков программированияЭксперт Python
 Аватар для Catstail
38179 / 21114 / 4307
Регистрация: 12.02.2012
Сообщений: 34,722
Записей в блоге: 14
11.02.2026, 15:01
Цитата Сообщение от AndrSlav Посмотреть сообщение
возможно ли в пайтон сделать программу для поиска устойчивых выражений?
- запрограммировать можно всё. При условии, что программист знает алгоритм. Ты знаешь, как "искать устойчивые выражения"? Если да - то ответ положительный. Если нет - то язык программирования не имеет значения.
0
71 / 59 / 14
Регистрация: 20.12.2013
Сообщений: 732
11.02.2026, 17:01  [ТС]
Цитата Сообщение от Catstail Посмотреть сообщение
Ты знаешь, как "искать устойчивые выражения"?
Так вот собственно потому и тему создал, чтобы алгоритм подсказали) Или куда копать)
А насчет языка - я пайтон вообще почти не знаю. Просто в нем много библиотек, а я более чем уверен, что по теме нейросети надо использовать. Но хотелось бы конкретики, вдруг у кого-то опыт был.
0
Эксперт .NET
 Аватар для Usaga
14299 / 9384 / 1353
Регистрация: 21.01.2016
Сообщений: 35,380
12.02.2026, 06:22
Цитата Сообщение от AndrSlav Посмотреть сообщение
а я более чем уверен, что по теме нейросети надо использовать.
Цитата Сообщение от AndrSlav Посмотреть сообщение
Интересно бы было самому написать, хоть в каком-то базовом варианте.
Так ты определись уже, самому писать или нейросети использовать.

Добавлено через 19 минут
Цитата Сообщение от AndrSlav Посмотреть сообщение
чтобы алгоритм подсказали
А здесь нет никакого алгоритма. И не надо быть программистом или знать питон, чтобы понимать почему. У выражений нет никаких атрибутов или признаков по которым некий алгоритм смог быть классифицировать фразу как идиому или устойчивое выражение. Выражение к таковым относится чисто по общему соглашению людей.

Единственное, что тут можно сделать - собрать набор таких выражений и проверять каждое входное предложение на нечёткое совпадение с одним из набора. Нейронка так и будет делать, по сути, сравнивая текст с учебными материалами, которая она видела и где рядом было "идиома" или "устойчивое выражение".
0
71 / 59 / 14
Регистрация: 20.12.2013
Сообщений: 732
12.02.2026, 08:39  [ТС]
В принципе думал как-то по контексту, типа если текст о мебели, и вдруг слон упоминается, то это кандидат. Это и ошибочно может быть, и многие выражения не попадутся, но хоть как-то. Только это видимо или сложно, или никак(
0
Эксперт .NET
 Аватар для Usaga
14299 / 9384 / 1353
Регистрация: 21.01.2016
Сообщений: 35,380
12.02.2026, 08:43
AndrSlav, это звучит как поход неизвестно куда, в поисках неизвестно чего.

Результат будет соответствующий.
0
71 / 59 / 14
Регистрация: 20.12.2013
Сообщений: 732
12.02.2026, 08:50  [ТС]
Цитата Сообщение от Usaga Посмотреть сообщение
Так ты определись уже, самому писать или нейросети использовать.
Я хотел сам попробовать нейросеть написать хоть в каком-то виде для интересной задачи.
Проблемы с тем чтобы придумать задачу, и чтобы по силам. Из данных у меня найдутся электронные книги, вот думаю какую задачу поставить для нейросети.
0
1712 / 579 / 76
Регистрация: 10.04.2009
Сообщений: 9,327
12.02.2026, 11:00
я почти уверен, что идиомы, аллегории, поговорки, пословицы, фразеологизмы можно искать в тексте с помощью библиотеки, какой не знаю)) - не было такой задачи - инет, ИИ в помощь))
0
Эксперт .NET
 Аватар для Usaga
14299 / 9384 / 1353
Регистрация: 21.01.2016
Сообщений: 35,380
12.02.2026, 11:02
Цитата Сообщение от AndrSlav Посмотреть сообщение
Я хотел сам попробовать нейросеть написать хоть в каком-то виде для интересной задачи.
Я бы рекомендовал начинать с задач попроще.
0
71 / 59 / 14
Регистрация: 20.12.2013
Сообщений: 732
12.02.2026, 11:38  [ТС]
Цитата Сообщение от Usaga Посмотреть сообщение
Я бы рекомендовал начинать с задач попроще.
Практика показала, что оптимально иметь задачу интересную, которая обычно сложная. И к ней уже стремиться решая здачи простые, нацеленные на аспекты сложной. А иначе бесполезно.
Я просто сейчас не вижу что бы вообще полезного для себя сделать с помощью нейросетей. Вот эту задачу запросами к гпт, но это просто практика использования апи. Примеры в мануалах - генерация текста, классификация - это для личного пользования не нужно. Перевод на другие языки - там вообще данные специальные нужны. Вот что бы придумать чтобы самому утилиту использовать...
0
1712 / 579 / 76
Регистрация: 10.04.2009
Сообщений: 9,327
12.02.2026, 11:42
Цитата Сообщение от AndrSlav Посмотреть сообщение
Вот что бы придумать чтобы самому утилиту использовать...
не понял проблемы с фантазией?
0
Эксперт .NET
 Аватар для Usaga
14299 / 9384 / 1353
Регистрация: 21.01.2016
Сообщений: 35,380
12.02.2026, 11:44
Цитата Сообщение от AndrSlav Посмотреть сообщение
Примеры в мануалах - генерация текста, классификация - это для личного пользования не нужно.
Так и твоя задача к классификации относится.

Цитата Сообщение от AndrSlav Посмотреть сообщение
Вот что бы придумать чтобы самому утилиту использовать...
Ну... Тогда тут совсем другая задача.
0
71 / 59 / 14
Регистрация: 20.12.2013
Сообщений: 732
12.02.2026, 11:50  [ТС]
Цитата Сообщение от Ципихович Эндрю Посмотреть сообщение
не понял проблемы с фантазией?
Ну да. Нужна задача для практики с нейросетями. Интересная и полезная (пусть даже только мне полезная). И сейчас вот хочется с текстами. Не просто классификация, а чтобы надо было подумать над архитектурой, алгоритмом.

Добавлено через 1 минуту
Цитата Сообщение от Usaga Посмотреть сообщение
Так и твоя задача к классификации относится.
Я в плане чтобы не просто feed-forward.
0
Эксперт .NET
 Аватар для Usaga
14299 / 9384 / 1353
Регистрация: 21.01.2016
Сообщений: 35,380
12.02.2026, 15:18
AndrSlav, все-таки надо разграничивать возможности своей компетенции. Если хочется научиться, то надо браться за вещи по-проще. Особенно учитывая, что тема ИИ весьма сложная. И уже потом браться за интересные задачи)
0
71 / 59 / 14
Регистрация: 20.12.2013
Сообщений: 732
12.02.2026, 16:44  [ТС]
Не ну хочется чего-то конкретного.
Я нейросети только на pytorch полистал.
Ок, с нуля пока не буду писать стараться.
Я с предобученными сетями тоже дел не имел. Я правильно понимаю, что есть много предобученных сетей бесплатных, и их можно попробовать доучивать для своих задач (или даже не доучивать)?
Просто не чувствую - какие-то вижу и слегка посмотрел чисто выделить лексемы, т.е. несложные функции.
Т.е. бесплатные тоже стоит смотреть, или они шлак с минимальным функционалом, чисто посмотреть интерфейс, а использовать только платные приходится (пару раз чат гпт пытался в браузере использовать а он везде деньги просил)?
Создалось впечатление, что и бесплатные вполне норм, но уточнить хочу, хочется сегодня определиться куда мне дальше смотреть-то.
0
Эксперт .NET
 Аватар для Usaga
14299 / 9384 / 1353
Регистрация: 21.01.2016
Сообщений: 35,380
13.02.2026, 07:51
Цитата Сообщение от AndrSlav Посмотреть сообщение
Т.е. бесплатные тоже стоит смотреть
Давно бы уже посмотрел. На HuggingFace их тонны на любой вкус и железо. Там и чистые веса есть, которые дообучать можно.
0
Эксперт функциональных языков программированияЭксперт С++
 Аватар для Royal_X
6221 / 2919 / 1046
Регистрация: 01.06.2021
Сообщений: 10,813
13.02.2026, 22:53
Цитата Сообщение от Ципихович Эндрю Посмотреть сообщение
я почти уверен, что идиомы, аллегории, поговорки, пословицы, фразеологизмы можно искать в тексте с помощью библиотеки, какой не знаю))
чёт маловероятно, что найдется какая-нибудь библиотека, которая будет знать все идиомы, аллегории, поговорки, пословицы, фразеологизмы... мне кажется, что словари нужно самому искать или составлять. А потом нужно написать код, который будет искать словосочетания, используя словари. Причем, для склонения слов уже можно использовать библиотеку, например, pymorphy.

Usaga, от локальных моделек малого размера толку мало, особенно, для русского языка. Даже моделей 14B будет недостаточно. А большие модели требуют очень много памяти.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
13.02.2026, 22:53
Помогаю со студенческими работами здесь

Регулярное выражение на поиск английских слов в строке
Предложите пожалуйста регулярное выражение для поиска английских слов с максимально возможными...

Регулярные выражения: поиск IP-адресов
Дан текстовый файл f. Вывести все IP-адреса на экран и в файл.

Регулярные выражение. Поиск
Здравствуйте. Подскажите пожалуйста со следующим моментом: import re l="Jack lives in New York...

Поиск неизвестной в арифметическом выражении (позиционные системы счисления)
Добрый день! Пытаюсь решить задачу: Дано арифметическое выражение: 3x15x15 + 1233x51 + xx +...

Регулярные выражения: поиск английских предложений среди русских
сижу несколько часов с https://regex101.com/r/ikORY1/2 и никак не пойму как английские слова...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
20
Ответ Создать тему
Новые блоги и статьи
Как дизайн сайта влияет на конверсию: 7 решений, которые реально повышают заявки
Neotwalker 08.03.2026
Многие до сих пор воспринимают дизайн сайта как “красивую оболочку”. На практике всё иначе: дизайн напрямую влияет на то, оставит человек заявку или уйдёт через несколько секунд. Даже если у вас. . .
Модульная разработка через nuget packages
DevAlt 07.03.2026
Сложившийся в . Net-среде способ разработки чаще всего предполагает монорепозиторий в котором находятся все исходники. При создании нового решения, мы просто добавляем нужные проекты и имеем. . .
Модульный подход на примере F#
DevAlt 06.03.2026
В блоге дяди Боба наткнулся на такое определение: В этой книге («Подход, основанный на вариантах использования») Ивар утверждает, что архитектура программного обеспечения — это структуры,. . .
Управление камерой с помощью скрипта OrbitControls.js на Three.js: Вращение, зум и панорамирование
8Observer8 05.03.2026
Содержание блога Финальная демка в браузере работает на Desktop и мобильных браузерах. Итоговый код: orbit-controls-threejs-js. zip. Сканируйте QR-код на мобильном. Вращайте камеру одним пальцем,. . .
SDL3 для Web (WebAssembly): Синхронизация спрайтов SDL3 и тел Box2D
8Observer8 04.03.2026
Содержание блога Финальная демка в браузере. Итоговый код: finish-sync-physics-sprites-sdl3-c. zip На первой гифке отладочные линии отключены, а на второй включены:. . .
SDL3 для Web (WebAssembly): Идентификация объектов на Box2D v3 - использование userData и событий коллизий
8Observer8 02.03.2026
Содержание блога Финальная демка в браузере. Итоговый код: finish-collision-events-sdl3-c. zip Сканируйте QR-код на мобильном и вы увидите, что появится джойстик для управления главным героем. . . .
Реалии
Hrethgir 01.03.2026
Нет, я не закончил до сих пор симулятор. Эта задача сложнее. Не получилось уйти в плавсостав, но оно и к лучшему, возможно. Точнее получалось - но сварщиком в палубную команду, а это значит, в моём. . .
Ритм жизни
kumehtar 27.02.2026
Иногда приходится жить в ритме, где дел становится всё больше, а вовлечения в происходящее — всё меньше. Плотный график не даёт вниманию закрепиться ни на одном событии. Утро начинается с быстрых,. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru