Форум программистов, компьютерный форум, киберфорум
PHP: RegExp
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.64/11: Рейтинг темы: голосов - 11, средняя оценка - 4.64
0 / 0 / 0
Регистрация: 18.02.2016
Сообщений: 21

Получить абсолютные ссылки

26.02.2016, 13:31. Показов 2093. Ответов 10
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Вообщем ситуация такая. Есть регулярное выражение, которое получает абсолютные ссылки (типа href="http://site.ru"), вот оно:
PHP
1
preg_match_all('~<a.*?href=".*?//.*?">.*?</a>~', '<a href="http://site.ru" class="link_external"><span class="link_text">Заголовок</span></a>',$array);
Оно в БОЛЬШИНСТВЕ СЛУЧАЕВ работает правильно, НО тем не менее не всегда, в этом случае регулярка тоже сработает, хоть ссылка(href="/page/123") и является относительной:
PHP
1
preg_match_all('~<a.*?href=".*?//.*?">.*?</a>~', '<a href="/page/123" class="item_class"><img class="class_image" src="https://site.ru/123.png">Заголовок c картикой</a>',$links_array);
Почему же она срабатывает? Ведь в href="/page/123" нету двойного слеша(что является обязательным условием прописанным в регулярке href=".*?//.*?"). Судя по всему, во втором случае регулярка срабатывает потому что, она(регулярка) "добралась" до других двойных слешей(до вот этих вот src="https://site.ru/123.png").

Теперь вопрос. Исходя из всего вышесказанного, как сделать так чтобы регулярка не принимал в расчет ни какие другие слеши, за исключением тех что указаны в атрибуте href тега <a>??
0
Лучшие ответы (1)
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
26.02.2016, 13:31
Ответы с готовыми решениями:

Абсолютные ссылки
Как известно, есть абсолютные и относительные ссылки бытует мнение, что для Яндекса внутри сайта лучше ставить абсолютные, вроде как они...

Относительные и абсолютные ссылки
Здравствуйте, товарищи!! У меня следующий вопрос - есть ли разница между относительными и абсолютными ссылками на сайте - т.е.,...

Ссылки:абсолютные и оносительные
Понадобилась новая страница. Сделал копию из старой. Переименовал, внес изменения. Все страницы лежат в корне. В старых страницах ставлю...

10
Фрилансер
Эксперт PythonЭксперт JSЭксперт PHP
 Аватар для Azdeman
1871 / 1362 / 604
Регистрация: 12.01.2011
Сообщений: 5,470
26.02.2016, 14:52
Ну можно же разбить вот так. И еще такую же написать. Только в поисках другой строки.
PHP
1
2
preg_match_all('~<a.*?href=".*?//.*?">.*?</a>~',$links_array,$m);
print_r($m);
0
0 / 0 / 0
Регистрация: 18.02.2016
Сообщений: 21
26.02.2016, 14:55  [ТС]
Но ведь это же тоже самое регулярное выражение что и я написал))
В чем подвох?)
Цитата Сообщение от Azdeman Посмотреть сообщение
preg_match_all('~<a.*?href=".*?//.*?">.*?</a>~',$links_array);
0
Фрилансер
Эксперт PythonЭксперт JSЭксперт PHP
 Аватар для Azdeman
1871 / 1362 / 604
Регистрация: 12.01.2011
Сообщений: 5,470
26.02.2016, 15:05
Цитата Сообщение от Owl123 Посмотреть сообщение
Судя по всему, во втором случае регулярка срабатывает потому что, она(регулярка) "добралась" до других двойных слешей(до вот этих вот src="https://site.ru/123.png").
Подвох в том что именно эта регулярка отдельно будет искать только там где совпадения //
https://regex101.com/r/zW8zR9/7
Или так
Найдите отличие называется
https://regex101.com/r/zW8zR9/9
0
0 / 0 / 0
Регистрация: 18.02.2016
Сообщений: 21
26.02.2016, 15:09  [ТС]
Ну да это я уже понял. Так а как это исправить? Чтобы она искала не просто // а href="....//......" ???
0
Фрилансер
Эксперт PythonЭксперт JSЭксперт PHP
 Аватар для Azdeman
1871 / 1362 / 604
Регистрация: 12.01.2011
Сообщений: 5,470
26.02.2016, 15:14
Цитата Сообщение от Owl123 Посмотреть сообщение
Чтобы она искала не просто // а href="....//......" ???
https://regex101.com/r/zW8zR9/10
Или у вас до до слеша может что то быть в первом варианте ? тогда так
https://regex101.com/r/zW8zR9/12
0
0 / 0 / 0
Регистрация: 18.02.2016
Сообщений: 21
26.02.2016, 15:20  [ТС]
Стоп.
Ну вот это же не правильно в регулряке писать "(<a href="http://site.ru" class="link_external"><span class="link_text">Заголовок</span></a>)"

У нас ведь содержимое между тегами <a></a> может быть самым разным. Там не должно быть никаких span ов. или еще чего то. Там должно быть что угодно то есть ".*?"

Еще раз задача такая нужно найти все <a> у которых href содержит в себе "//". Вот и все
0
Фрилансер
Эксперт PythonЭксперт JSЭксперт PHP
 Аватар для Azdeman
1871 / 1362 / 604
Регистрация: 12.01.2011
Сообщений: 5,470
26.02.2016, 15:26
Я вас не понимаю видать. в эту регулярку не попадает
Цитата Сообщение от Owl123 Посмотреть сообщение
href="/page/123" нету двойного слеша(что является обязательным условием прописанным в регулярке href=".*?//.*?")
https://regex101.com/r/zW8zR9/13

Добавлено через 1 минуту
Цитата Сообщение от Owl123 Посмотреть сообщение
не правильно в регулряке писать "(<a href="http://site.ru" class="link_external"><span class="link_text">Заголовок</span></a>)"
Зачем вы тогда у себя это пишите?
Цитата Сообщение от Owl123 Посмотреть сообщение
preg_match_all('~<a.*?href=".*?//.*?">.*?</a>~', '<a href="http://site.ru" class="link_external"><span class="link_text">Заголовок</span></a>',$array);
0
0 / 0 / 0
Регистрация: 18.02.2016
Сообщений: 21
26.02.2016, 15:31  [ТС]
Цитата Сообщение от Azdeman Посмотреть сообщение
в эту регулярку не попадает
Как это не попадает? Попробуйте вот этот текст.

<a href="/page/123" class="item_class"><img class="class_image" src="https://site.ru/123.png">Заголовок c картикой</a>

Он попадет. Именно в этом то и проблема. Собственно ради этого и писался весь пост)
0
1137 / 685 / 412
Регистрация: 07.11.2015
Сообщений: 1,102
26.02.2016, 16:31
Лучший ответ Сообщение было отмечено Owl123 как решение

Решение

Матасимвол точка совпадает с любым символом кроме перевода строки.
Вместо .*? внутри <A> использовать [^>]* и [^"]+
Code
1
(<a[^>]+href="[^"]+//[^>]+>.*?</a>)
https://regex101.com/r/zW8zR9/14
1
0 / 0 / 0
Регистрация: 18.02.2016
Сообщений: 21
26.02.2016, 16:39  [ТС]
ЗАРАБОТАЛООООООООООООО!
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
26.02.2016, 16:39
Помогаю со студенческими работами здесь

Относительные или абсолютные ссылки?
Товарищи! Подскажите имеем сайт, начал он свою деятельность 1,5 месяца назад. На сегодняшний день в индексе 2000стр. Общая масса 7000, Тиц...

Изменить ссылки для изображений на абсолютные
Проблема в следующем: Есть сайт на битриксе, у него есть API реализованный таким образом $PostApi = new Restify(, 'defaults select'...

Как изменить относительные ссылки на абсолютные
Добрый день! Есть таблица с данными на 1500 строк. На другом листе нужно разместить часть данных из этой таблицы. В исходной таблице...

Заказчик заставляет делать абсолютные ссылки
Пишу движок. Заказчик хочет везде абсолютные ссылки. http://site.ru/folder/page.html А вот такие не катят уже? folder/page.html...

Абсолютные ссылки для внутренней перелинковки
Вот недавно задался вопросом - вроде как абсолютные ссылки вида http://mysite.ru/page1.html лучше для получения сео эффекта от внутренней...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
11
Ответ Создать тему
Новые блоги и статьи
Access
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином. Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов. . . .
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
Создание Single Page Application на фреймах
krapotkin 16.11.2025
Статья исключительно для начинающих. Подходы оригинальностью не блещут. В век Веб все очень привыкли к дизайну Single-Page-Application . Быстренько разберем подход "на фреймах". Мы делаем одну. . .
Фото: Daniel Greenwood
kumehtar 13.11.2025
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru