Форум программистов, компьютерный форум, киберфорум
PHP: RegExp
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.71/14: Рейтинг темы: голосов - 14, средняя оценка - 4.71
 Аватар для mokojumbot
160 / 160 / 30
Регистрация: 09.11.2012
Сообщений: 1,008

regexp парсинг ссылок

17.11.2012, 05:39. Показов 2923. Ответов 1
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
нужно с сайта парсить ссылки вида
Code
1
<a href="/shop/catalog/nout_pc/nout/netbook/?search=blabla" class="bold a_titles">blabla</a>
а есть такие-же ссылки, но без класса.
мне нужны те, что с классом. Точнее то, что после catalog/ и перед /. В данном случае - nout

Не знаю как составить регулярное выражение.. Пробовал:
PHP
1
2
3
if (preg_match_all("/(?<=<a href=\"\/shop\/catalog)[a-z0-9_]{1,30}(?=\/)/", $f[$_GET['kid']], $looked))
    print_r($looked);
else echo 'nothing found<br>';
всё, что перед <a href="/shop/catalog и перед / - один фиг не находит ничего.

с переменной $f[$_GET['kid']] всё в порядке, выводится нормально.

Добавлено через 48 минут
после catalog забыл слеш \/

вопрос с классом открыт

Добавлено через 33 минуты
методом тыка разобрался
PHP
1
"/(?<=<a href=\"\/shop\/catalog\/)[_a-z0-9]+(?=\/.{1,70}bold)/"
в выражении (?=) и (?<=) нельзя использовать неявную длину типа * или +
пипец, и негде об этом прочитать даже, сколько не искал.
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
17.11.2012, 05:39
Ответы с готовыми решениями:

Вывод структуры сайта. Парсинг ссылок
Доброго времени суток, уважаемые программисты. ---------- Я столкнулся с такой проблемой: необходимо написать программу, которая...

Парсинг ссылок. Регулярки или автомат?
Здравствуйте! Задача состоит в том, чтобы проверять ссылки на валидность и в случае, если ссылка правильная, тогда изымать из нее нужную...

preg_match? парсинг и вывод списка ссылок?
Есть страница, на ней от1 до 24 ссылки (точнее картинки), как мне выпарсить ссылки на все ети картинки и вывести их? пример кода хтмл...

1
112 / 93 / 15
Регистрация: 03.10.2012
Сообщений: 315
20.11.2012, 15:25
Почему парсинг HTML всегда упирается в регулярки? Почему не использовать DOMDocument? Там и поиск пол имени тэга, и прочие плюшки...
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
20.11.2012, 15:25
Помогаю со студенческими работами здесь

Парсинг массива ссылок
Здравствуйте! На сайте есть страница новостей, которая имеет 32 перехода, на каждой странице видно лишь ближайшие 5 переходов Нужно...

Curl парсинг страницы и подмена ссылок
Как мне в полученной странице пройтись по всем ссылкам и привести к такому виду. что имеем /directory/ что нужно ...

RegExp парсинг сайта
Друзья, помогите реализовать одну штуку. Есть страница с товарами. Мне нужно заходить на каждый товар, распарсивать его , а после...

RegExp: Парсинг страницы по разным значаниям
Имеется вот такой код на странице: &lt;li class='clear clearfix'&gt; &lt;span class='row_title'&gt;Группа:&lt;/span&gt; &lt;span...

Парсинг ссылок
href=&quot;javascript:void(0)&quot;...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
2
Ответ Создать тему
Новые блоги и статьи
Thinkpad X220 Tablet — это лучший бюджетный ноутбук для учёбы, точка.
Programma_Boinc 23.12.2025
Thinkpad X220 Tablet — это лучший бюджетный ноутбук для учёбы, точка. Рецензия / Мнение Это мой обзор планшета X220 с точки зрения школьника. Недавно я решила попытаться уменьшить свой. . .
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта Симптом: После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
Как объединить две одинаковые БД Access с разными данными
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином. Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов. . . .
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru