Форум программистов, компьютерный форум, киберфорум
Python для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск  
 
 
71 / 59 / 14
Регистрация: 20.12.2013
Сообщений: 732

Поиск разговорных выражений

10.02.2026, 22:58. Показов 1450. Ответов 25
Метки нет (Все метки)

Здравствуйте.
Решил посмотреть немного пайтон. Но просто читать не особо интересно, да и почти бесполезно.
Подскажите, пожалуйста, а возможно ли в пайтон сделать программу для поиска устойчивых выражений? Может подскажете какие библиотеки, какая теория? Вообще какую идею можно заложить, и можно ли вообще?

Т.е. вот есть текст, найти не через поиск в строках, а именно по смыслу выражения типа "семь раз отмерь-один раз отрежь", "как слон в посудной лавке".
Т.е. выражения, которые формально в тексте вообще ни к месту, в них вообще как будто говорится о вещах не из контекста, а реальный смысл не прямой.

Это видимо нейросети можно попробовать, но по примерам (которые тем более пока слабо понимаю) не ясно в принципе как можно организовать.
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
10.02.2026, 22:58
Ответы с готовыми решениями:

Поиск повторяющихся друг за другом слов с использованием регулярных выражений
Дан следующий текст: 'hello world hello hello hello world worldhellohellohello' Какое должно...

Дано выражение вида "а x b", а и b - натуральные числа, x - сравнения, Истинно ли данное выражение?
Формат входных данных: В первой строке число а, во второй знак сравнения, в третьей - число b. Оба...

Задачи на регулярные выражения - поиск количества слов
Слово — это последовательность из букв (русских или английских), внутри которой могут быть дефисы....

25
71 / 59 / 14
Регистрация: 20.12.2013
Сообщений: 732
14.02.2026, 01:03  [ТС]
Цитата Сообщение от Usaga Посмотреть сообщение
Давно бы уже посмотрел. На HuggingFace их тонны на любой вкус и железо.
Да это-то я видел, но из того что посмотрел там как-то убогонько для этой задачи. Но я пока мало посмотрел. ГПТ находит, но тоже не все, я на примере текста попробовал.
В общем, я понял не вариант такое самому писать) Буду гпт использовать.
0
Эксперт .NET
 Аватар для Usaga
14354 / 9457 / 1360
Регистрация: 21.01.2016
Сообщений: 35,654
14.02.2026, 06:59
Royal_X, GPT-OSS-20B много памяти не требует, но демонстрирует выдающиеся (для локальной модели) результаты.

Но и попробовать эти модели ничего не стоит, в сравнении с тем, что ТС не имея компетенций, задумал писать самостоятельно.
0
-72 / 65 / 2
Регистрация: 23.11.2024
Сообщений: 807
14.02.2026, 07:11
Цитата Сообщение от AndrSlav Посмотреть сообщение
алгоритм подсказали) Или куда копать)
Для этого есть специальные люди - лингвисты.
0
Эксперт .NET
 Аватар для Usaga
14354 / 9457 / 1360
Регистрация: 21.01.2016
Сообщений: 35,654
14.02.2026, 08:57
Tupiel Reuschin, лингвисты умеют определять идиомы в тексте? Офигеть)
0
 Аватар для Aviz__
2761 / 2068 / 510
Регистрация: 17.02.2014
Сообщений: 9,500
15.02.2026, 09:59
AndrSlav, вот тебе вариант дорожной карты, который не позволят энтузиазму угаснуть через 11 дней:

Забудь про "слона в посудной лавке" как про метод. Это тупик.

Начни с простого словаря. Нагугли файл с идиомами. Напиши скрипт, который ищет их в тексте. Разберись с pymorphy2. Это даст первый рабочий результат и понимание основ.

Сделай шаг в сторону AI. Установи sentence-transformers. Используй тот же словарь и сравнивай векторы предложений. Ты увидишь, как компьютер начинает "понимать" смысл. Это будет твоим первым серьезным успехом в NLP.

И только потом, если будет интересно, задумайся о дообучении BERT. К тому моменту ты уже будешь понимать 90% терминов, которыми тут разбрасываются.
1
-72 / 65 / 2
Регистрация: 23.11.2024
Сообщений: 807
15.02.2026, 10:55
Цитата Сообщение от Aviz__ Посмотреть сообщение
через 11 дней
Откуда взялся такой срок?
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
15.02.2026, 10:55

Регулярное выражение на поиск английских слов в строке
Предложите пожалуйста регулярное выражение для поиска английских слов с максимально возможными...

Регулярные выражения: поиск IP-адресов
Дан текстовый файл f. Вывести все IP-адреса на экран и в файл.

Регулярные выражение. Поиск
Здравствуйте. Подскажите пожалуйста со следующим моментом: import re l="Jack lives in New York...

Поиск неизвестной в арифметическом выражении (позиционные системы счисления)
Добрый день! Пытаюсь решить задачу: Дано арифметическое выражение: 3x15x15 + 1233x51 + xx +...

Регулярные выражения: поиск английских предложений среди русских
сижу несколько часов с https://regex101.com/r/ikORY1/2 и никак не пойму как английские слова...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
26
Ответ Создать тему
Новые блоги и статьи
[golang] Конкурентный fetcher с ограничением максимального количества одновременных HTTP запросов.
alhaos 10.06.2026
Задача Реализовать конкурентный fetcher с ограничением максимального количества одновременных HTTP запросов. Сигнатура func Fetch(urls string, maxConcurrent int) Result Пример urls :=. . .
[golang] Состояние гонки (race condition)
alhaos 10.06.2026
Состояние гонки (race condition) Состояние гонки (Race Condition) — это ошибка, возникающая при одновременном доступе нескольких горутин к одним и тем же данным без должной синхронизации. При этом. . .
Взрослые отношения, и почему они не получаются
kumehtar 09.06.2026
Когда в детстве ребёнок не получает от родителей чего-то важного, он лишается не просто приятных переживаний, а основы для формирования определённых внутренних качеств и навыков. Если ребёнок не. . .
[golang] Worker Pool
alhaos 09.06.2026
Worker Pool Worker Pool — паттерн конкурентной обработки задач в Go. Суть: фиксированное количество горутин-воркеров читают задачи из общего канала и пишут результаты в общий канал результатов. . . .
[golang] Pipeline
alhaos 08.06.2026
Pipeline Pipeline — паттерн конкурентной обработки данных в Go. Суть: данные проходят через цепочку независимых стадий, каждая из которых работает в своей горутине и общается с соседями через. . .
Свет внутри себя
kumehtar 07.06.2026
Пусть это будет здесь lIs4oanZS9Y
Программа для com-порта
Uhbif79 05.06.2026
Всем привет, давно хотел изучить Qt, начинал, бросал, потом снова начинал. И сейчас вот смог написать свою первую программу. До этого имел опыт программирования микроконтроллеров, писал прошивки на. . .
Транскрипция 55-минутного видео через Whisper: WhisperDesktop облажался, спас Google Colab[
anaschu 01.06.2026
Понадобилось получить текст из свежезагруженного видео на YouTube. Казалось бы, задача на пять минут. Заняла полтора часа. Делюсь опытом — может кому пригодится последовательность решений. . . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru