Форум программистов, компьютерный форум, киберфорум
PHP для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
365 / 124 / 22
Регистрация: 08.01.2015
Сообщений: 1,418
Записей в блоге: 2

Алгоритм поиска слов в строках на основе правил

29.03.2025, 16:34. Показов 1264. Ответов 4
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Есть много различных строк текста. Каждая строка состоит из отдельных слов, разделенных пробелами.
Мне нужно определить, содержатся ли в той или иной строке искомые (заданные) слова с учетом поисковых правил. Например, нужно определить, имеются ли в каждой из строк данные слова:
Code
1
дом ИЛИ дерево И мяч
Т.е. содержит ли строка или слово "дом", или одновременно оба слова "дерево", "мяч".
Это - только пример, могут быть и другие самые разные правила, скажем:
Code
1
(дом ИЛИ дерево) И мяч ИЛИ трава
Если интересно, это мне нужно для своего алгоритма поиска по ключевым словам на сайтах (в интернете или локальном, на своем компьютере). Каждая строка - это, по сути, набор ключевых слов, разделенных пробелами.
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
29.03.2025, 16:34
Ответы с готовыми решениями:

Поиск слов в строках, оптимизация
Есть такая задача: Найти в исходном тексте слова которые повторяются 2 и больше раз, и найти в каждую строку которая содержит в себе все...

Поиск в нескольких строках
Здравствуйте. Мне надо вытащить из страницы все ссылки. Воспользовался следующим регэкспом $strPage = file_get_contents($url); ...

Поиск фразы во всех строках
Здарвствуйте!В файле есть много строк в которых есть разделители.Нужно скопировать и вывести пользователю фразу, которая находится между...

4
Фрилансер
Эксперт PythonЭксперт JSЭксперт PHP
 Аватар для Azdeman
1871 / 1362 / 604
Регистрация: 12.01.2011
Сообщений: 5,470
29.03.2025, 18:47
PHP
1
2
3
4
5
6
7
8
9
10
function search($str){
$pravilo = [
    "(дом|дерево).*?мяч",
    "(дом|дерево).*?(мяч|трава)"
];
    preg_match_all("~".$pravilo[0]."~uis",$str,$m);
    return count(array_filter($m)) > 0 ? 'Содержит ключевые слова' : 'Нет';
}
$str = 'Лалала, дом красивый и мяч';
echo search($str);
1
365 / 124 / 22
Регистрация: 08.01.2015
Сообщений: 1,418
Записей в блоге: 2
29.03.2025, 19:51  [ТС]
Azdeman, интересное решение, спасибо. Но, как быть, если порядок слов не будет совпадать для условия И? Например, если взять
PHP
1
$str = 'Лалала, мяч красивый и дом';
Перебор (перестановку) делать не хотелось бы...

Добавлено через 5 минут
Я вот тут придумал еще одну вещь. Предлагаю обсудить.
Возьмем первое выражение - критерий:
Code
1
дом ИЛИ дерево И мяч
Что, если сделать поиск по строке и определить, содержатся ли в ней слова дом, дерево, мяч. Получатся соответствующие логические переменные (true|false). И в выражении (критерии для поиска) заменить их.

Для строки "Лалала, мяч красивый и дом" получится
true || (false && true)
И потом - оцениваем полученное логическое выражение через eval. Опасаться будет нечего, т.к. всего м.б. два возможных результата.

Интуитивно-то чувствую, что, вроде, должно(?) работать. Вот если бы как-то строго доказать это.
0
Фрилансер
Эксперт PythonЭксперт JSЭксперт PHP
 Аватар для Azdeman
1871 / 1362 / 604
Регистрация: 12.01.2011
Сообщений: 5,470
29.03.2025, 23:16
Цитата Сообщение от Htext Посмотреть сообщение
если порядок слов не будет совпадать для условия И?
PHP
1
2
3
4
5
6
7
8
9
10
11
12
13
<?php
function search($str){
$pravilo = [
    "((дом|дерево).*?мяч)|(мяч.*?(дом|дерево))",
    "((дом|дерево).*?(мяч|трава)|(мяч|трава).*?(дом|дерево))"
];
    preg_match_all("~".$pravilo[0]."~uis",$str,$m);
    return count(array_filter($m)) > 0 ? 'Содержит ключевые слова' : 'Нет';
}
$str = 'Лалала, мяч и красивый дом';
echo search($str);
 
?>

P.S. Вы можете описать любые шаблоны, в зависимости от вашей задачи
1
365 / 124 / 22
Регистрация: 08.01.2015
Сообщений: 1,418
Записей в блоге: 2
02.04.2025, 09:02  [ТС]
Добавлено через 21 минуту
В итоге, максимальное число (искомых) ключевых слов N в регулярном выражении составит n!*n, где n - число ключевых слов в критерии поиска. Это если будут одни только операторы И, без ИЛИ. Т.е., в общем случае, если могут быть оба этих оператора:
n <= N <= n!*n
По идее, согласен, такой способ тоже имеет право на существование. В общем случае, для небольшого числа ключевых слов.
Я протестировал. Время, затрачиваемое на поиск, примерно одинаково и в вашем, и в моем способах (для чисел различных ключевых слов 2...6). Правда, чтобы составить регулярное выражение, в общем придется делать синтаксический анализатор критерия поиска, распарсивать его, исходя из наличия скобок, операторов И, ИЛИ. Есть, разумеется, еще проблема с максимально допустимым размером Р.В. (ибо - баг там есть). Но, это уже второй вопрос.
1
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
02.04.2025, 09:02
Помогаю со студенческими работами здесь

Поиск одинаковых подстрок в строках
Имеется 2 урла, нужно получить одинаковые их части. Подскажите, желательно какую-нибудь стандартную функцию php. Что-то ниче в голову не...

Поиск и замена в строках
Напечатайте заданную последовательность символов, заменяя каждую точку многоточием.

Поиск вхождения в строках
Всем привет! Не могу понять... Как вывести 1 и последнюю строку? Ниже пример не работает. Может есть какие-то другие способы? ...

Тонкости сложных переменных в строках
По истине удивительные и, в то же время, странные вещи позволяет делать синтаксис сложных переменных в строках. Даже редакторы такой код не...

Создание формы поиска на сайте. Почему не выводится результат поиска при вводе символов в поле поиска?
Добрый день! Создаю форму поиска с всплывающими подсказками. Попробую, выложить строки кода, имеющие отношение к сути проблемы и темы. ...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
5
Ответ Создать тему
Новые блоги и статьи
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта Симптом: После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
Access
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином. Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов. . . .
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
Создание Single Page Application на фреймах
krapotkin 16.11.2025
Статья исключительно для начинающих. Подходы оригинальностью не блещут. В век Веб все очень привыкли к дизайну Single-Page-Application . Быстренько разберем подход "на фреймах". Мы делаем одну. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru