Форум программистов, компьютерный форум, киберфорум
PHP: RegExp
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.80/5: Рейтинг темы: голосов - 5, средняя оценка - 4.80
0 / 0 / 0
Регистрация: 03.02.2012
Сообщений: 36

Опережающая проверка и dotall регулярное выражение

22.01.2015, 21:12. Показов 957. Ответов 7
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Начну с того, что прекрасно понимаю, что парсить html не стоит с помощью регулярных выражений, но в данном случае просто по быстрому нужно было реализовать кое-что. В итоге напоролся на проблему и теперь интересно её решение. Исходные данные:

HTML5
1
2
3
4
5
Lorem <a data-smth-id="1" href="#">ipsum dolor sit amet</a>, consectetur adipiscing elit.
<a data-smth-id="2" href="#">Sed ut maximus turpis. In pulvinar pulvinar mattis.
Suspendisse dapibus</a> a orci eu suscipit.
<a id="smth_to_smw" href="#">In quis erat non nisl vehicula egestas.</a>
Etiam interdum semper cursus.
Есть следующее регулярное выражение: #<a(?!.*id="smth_to_smw").*>(.*)</a>#iU

Этим выражением я хочу получить все элементы a в которых отсутсвует id указанный в регулярном выражении. И действительно если содержание ссылки находится на одной строке то всё работает как нужно. Вторую ссылку не находит по причине того, что символ точка в регулярном выражении по умолчанию равен всем символам кроме символа переноса строки. Отсюда следует, что к регулярному выражению логично добавить флаг s (dotall), но после этого вместо ожидаемой работы регулярное выражение не находит вообще ничего. Может кто знает в чём проблема?
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
22.01.2015, 21:12
Ответы с готовыми решениями:

Составить регулярное выражение (проверка на переменную)
Вообщем нужно составить регулярное выражение. Длина переменной от 1 до 127 символов. Первая буква должна быть Обязательно на...

Preg_match Проверка группы переменных на регулярное выражение
Здравствуйте! Подскажите пожалуйста, как можно сразу проверить несколько переменных на регулярное выражение? чтоб не делать отдельную...

регулярное выражение
Надо написать регулярное выражение является ли оно даттой начиная с 1600 до 9999... строка типа: 1) 29/04/2000 2) 29-01-9999 3)...

7
368 / 406 / 165
Регистрация: 29.05.2014
Сообщений: 1,494
22.01.2015, 22:10
Чувствую отстаю от жизни. Что это такое?
data-smth-id
0
 Аватар для Lazy_Den
3325 / 2845 / 1423
Регистрация: 15.01.2014
Сообщений: 6,170
22.01.2015, 23:08
Цитата Сообщение от BarbosLV Посмотреть сообщение
Что это такое?
Собственный атрибут, для хранения каких-либо данных. Вот тут в общих чертах описано.
0
0 / 0 / 0
Регистрация: 03.02.2012
Сообщений: 36
22.01.2015, 23:34  [ТС]
Решения найдено. Вместо "." внутри тега и флага доталл нужно использовать символьный класс "[\s\S]". Вот только интересно по какой причине с флагом доталл не хочет работать.
0
-72 / 10 / 4
Регистрация: 01.09.2009
Сообщений: 163
23.01.2015, 02:33
PHP
1
2
3
4
5
6
7
8
9
$txt='Lorem <a data-smth-id="1" href="#">ipsum dolor sit amet</a>, consectetur adipiscing elit.
<a data-smth-id="2" href="#">Sed ut maximus turpis. In pulvinar pulvinar mattis.
Suspendisse dapibus</a> a orci eu suscipit.
<a id="smth_to_smw" href="#">In quis erat non nisl vehicula egestas.</a>
Etiam interdum semper cursus.';
 
$txt=preg_replace('#<a.*id="smth_to_smw".*>.*</a>#miU','',$txt);
 
echo $txt,"\n";
Цитата Сообщение от jeremen Посмотреть сообщение
прекрасно понимаю, что парсить html не стоит с помощью регулярных выражений
а чем же их парсить?
0
0 / 0 / 0
Регистрация: 03.02.2012
Сообщений: 36
23.01.2015, 13:11  [ТС]
http://php.net/manual/en/book.dom.php к примеру, и другими подобными библиотеками. HTML это синтетический язык с четкой спецификацией. Или вы думаете браузер его регулярками парсит?
0
-72 / 10 / 4
Регистрация: 01.09.2009
Сообщений: 163
23.01.2015, 13:16
Цитата Сообщение от jeremen Посмотреть сообщение
http://php.net/manual/en/book.dom.php к примеру, и другими подобными библиотеками.
ага, т.е. парсить регулярками, завёрнутыми в ООП
ясно, понятно.

HTML это синтетический язык с четкой спецификацией. Или вы думаете браузер его регулярками парсит?
нет, телепатически он его парсит.
вы сначала задумайтесь, какие у машины вообще варианты есть, чтобы текст найти
точно также каждую строку исследует на предмет знакомых букв
только на C++

ну я может чего не знаю? может скайнет уже изобрёл что-то новое, просветите
0
0 / 0 / 0
Регистрация: 03.02.2012
Сообщений: 36
23.01.2015, 14:32  [ТС]
tip78, Вы вообще понимаете значение слов которые используете?
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
23.01.2015, 14:32
Помогаю со студенческими работами здесь

Регулярное выражение
Как ето сделать? Написать регулярное выражение, которое определяет является ли входная лента лентой...

Регулярное выражение
Доброе утро, вчера столкнулся с проблемой правильности регулярного выражения в общем есть такое выражение /\+)]\((+)\)/i И...

Регулярное выражение
Вытаскивая из строчки, помещаем содержимое в подобные выражения $1, $2... Вопрос, когда не находим того что нас интересует. То есть $1...

Регулярное выражение
Доброго времени суток. Помогите правильно составить регулярное выражение. Нужно, чтобы оно проверяло введенную пользователем сумму...

Регулярное выражение
Собственно не могу понять. В онлайновом редакторе регулярок все работает, но стоит засунуть в php и fail за fail'ом Вот тут у них...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
8
Ответ Создать тему
Новые блоги и статьи
делаю науч статью по влиянию грибов на сукцессию
anaschu 13.03.2026
прикрепляю статью
SDL3 для Desktop (MinGW): Создаём пустое окно с нуля для 2D-графики на SDL3, Си и C++
8Observer8 10.03.2026
Содержание блога Финальные проекты на Си и на C++: hello-sdl3-c. zip hello-sdl3-cpp. zip Результат:
Установка CMake и MinGW 13.1 для сборки С и C++ приложений из консоли и из Qt Creator в EXE
8Observer8 10.03.2026
Содержание блога MinGW - это коллекция инструментов для сборки приложений в EXE. CMake - это система сборки приложений. Здесь описаны базовые шаги для старта программирования с помощью CMake и. . .
Как дизайн сайта влияет на конверсию: 7 решений, которые реально повышают заявки
Neotwalker 08.03.2026
Многие до сих пор воспринимают дизайн сайта как “красивую оболочку”. На практике всё иначе: дизайн напрямую влияет на то, оставит человек заявку или уйдёт через несколько секунд. Даже если у вас. . .
Модульная разработка через nuget packages
DevAlt 07.03.2026
Сложившийся в . Net-среде способ разработки чаще всего предполагает монорепозиторий в котором находятся все исходники. При создании нового решения, мы просто добавляем нужные проекты и имеем. . .
Модульный подход на примере F#
DevAlt 06.03.2026
В блоге дяди Боба наткнулся на такое определение: В этой книге («Подход, основанный на вариантах использования») Ивар утверждает, что архитектура программного обеспечения — это структуры,. . .
Управление камерой с помощью скрипта OrbitControls.js на Three.js: Вращение, зум и панорамирование
8Observer8 05.03.2026
Содержание блога Финальная демка в браузере работает на Desktop и мобильных браузерах. Итоговый код: orbit-controls-threejs-js. zip. Сканируйте QR-код на мобильном. Вращайте камеру одним пальцем,. . .
SDL3 для Web (WebAssembly): Синхронизация спрайтов SDL3 и тел Box2D
8Observer8 04.03.2026
Содержание блога Финальная демка в браузере. Итоговый код: finish-sync-physics-sprites-sdl3-c. zip На первой гифке отладочные линии отключены, а на второй включены:. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru