Форум программистов, компьютерный форум, киберфорум
PHP: RegExp
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.75/8: Рейтинг темы: голосов - 8, средняя оценка - 4.75
55 / 55 / 21
Регистрация: 01.03.2016
Сообщений: 594

Нужна быстрая регулярка для поиска внешних ссылок в тегах <a>, которые не являются внутренними

17.03.2016, 01:38. Показов 1693. Ответов 11

Студворк — интернет-сервис помощи студентам
ищу готовую и БЫСТРУЮ регулярку, для поиска внешних ссылок в тегах <a> которые не являются внутренними с последующей заменой для промежуточной страницы
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
17.03.2016, 01:38
Ответы с готовыми решениями:

Инструменты поиска внешних ссылок на сайт
Как делать? 1. Если ты владелец сайта - то многие ссылки (но не все в общем случае увы...) могут дать инструменты гугла и яндекса для...

Регулярка для замены ссылок
вот такую регулярку составил function zamenalik_category ($links) { $links = preg_replace...

Регулярка для абсолютно всех ссылок
Существует переменная с сылками разного рода: $html = ' &lt;link href=&quot;css/bootstrap.min.css&quot; rel=&quot;stylesheet&quot;&gt; ...

11
Фрилансер
Эксперт PythonЭксперт JSЭксперт PHP
 Аватар для Azdeman
1871 / 1362 / 604
Регистрация: 12.01.2011
Сообщений: 5,470
17.03.2016, 15:03
Приведите пример ссылок. Не совсем понял.
какие расширение должно пропускать php или html или и то и другое и т.д
набросал примерчик. но тут расширений вообще нет .. можно хоть .323 ввести
PHP
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
<?php
echo "<pre/>";
$a = array(
            "<a href='index.php?fid=12'>Ссылка</a>",
            "<a href='index.php'>Ссылка2 </a>",
            "<a href='index^%php'>Ссылка4 </a>",
            "<a href='index'>Ссылка4 </a>",
            "<a href='inde44335.php'>Ссылка4 </a>"
            );
        foreach ($a as $v){
            if(preg_match("~<a\s*href=[\"'][\w]+(\.[\w?_=\~]+)?[\"']>[\wа-яёА-ЯЁ]+\s*<\/a>~u",$v)){
                echo htmlspecialchars($v)."<br/>";
            }
        }
?>
0
55 / 55 / 21
Регистрация: 01.03.2016
Сообщений: 594
18.03.2016, 13:13  [ТС]
Azdeman, Есть переменная с много строчным значением. Нужно найти значение атрибута href в теге <A>. Только те, что не начинаются на www.www.nu или не имеют протокола.
т.е. внешние. Шаблон для них (.*).
Затем их нужно заменить, а заменять я буду сторонней функцией, т.е. нужно будет ей передать значение, а она вернет новое.
0
Фрилансер
Эксперт PythonЭксперт JSЭксперт PHP
 Аватар для Azdeman
1871 / 1362 / 604
Регистрация: 12.01.2011
Сообщений: 5,470
18.03.2016, 15:55
PHP
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
<?php
    $silci = " wdwqdw efefbergnegergergerngerger
gergergergergenrgern                <a href='site.php'>Главная</a>
        ffregreg        <a href='site123.php'>Главная</a> fwebfwbfewbfwbefwbefw
bergbergbe      egebgerbgebgerbe        <a href='www.site123.com'>Главная</a>
    bfwebfwebfwbfw          <a href='www.site123?index=123'>Главная</a> dwdwefbwfbf
        bgebgerbgerbge      <a href='123.html'>Главная</a> bebgebgebe
    begbergb            <a href='index'>Главная</a> dwewfbewfbwfebw
                ";
    
preg_match_all("~<a\s*href=[\"']((?!www|http|https)[\w]+(\.(php|html))?)[\"']>[\wа-яёА-ЯЁ]+\s*<\/a>~",$silci,$m);
    foreach ($m[0] as $v){
        echo htmlspecialchars($v)."</br>";
    }
?>
0
55 / 55 / 21
Регистрация: 01.03.2016
Сообщений: 594
18.03.2016, 20:01  [ТС]
Azdeman, у вас конечно все очень строго для меня))(href может быть любым по счету аргументом, не обяз первым). Вы предлогаете сделать массив из совпадений и потом произвести обработку элементов. А что если сделать прег пеплайс с колл бэк ? Медленнее будет?
0
Фрилансер
Эксперт PythonЭксперт JSЭксперт PHP
 Аватар для Azdeman
1871 / 1362 / 604
Регистрация: 12.01.2011
Сообщений: 5,470
18.03.2016, 20:41
Цитата Сообщение от 53ifbb Посмотреть сообщение
А что если сделать прег пеплайс с колл бэк ?
Ну если будете заменять то да это выход конечно же.

Добавлено через 18 секунд
Цитата Сообщение от 53ifbb Посмотреть сообщение
href может быть любым по счету аргументом, не обяз первым
не понял.
0
55 / 55 / 21
Регистрация: 01.03.2016
Сообщений: 594
18.03.2016, 20:43  [ТС]
Цитата Сообщение от Azdeman Посмотреть сообщение
не понял.
вот тут <a\s*href может быть title например... ) т.е. надо <a.*href
0
Фрилансер
Эксперт PythonЭксперт JSЭксперт PHP
 Аватар для Azdeman
1871 / 1362 / 604
Регистрация: 12.01.2011
Сообщений: 5,470
18.03.2016, 20:45
Цитата Сообщение от 53ifbb Посмотреть сообщение
вот тут <a\s*href может быть title например... ) т.е. надо <a.*href
Понятно, я же это не знал. Это можно всё поправить .
0
55 / 55 / 21
Регистрация: 01.03.2016
Сообщений: 594
18.03.2016, 22:04  [ТС]
Azdeman, в общем я написал фун-ю которая принимает Url и обрабатывает его как нужно. Возвращает новое значение.

Теперь на примерах.
Имеем теги:
HTML5
1
2
3
4
<a href="http://mysite.ru/index.pl">др. версия</a>
<a href="uploads/" target="_blank">др. версия</a>
<a href="http://kuki.ru">kuki.ru</a>
<a href="http://wiki.ru" target="_blank">wiki.ru</a>
Вот что нужно - обработать урл и если урл вернулся с изменениями, то добавить target="_blank" только там, где его нет!
какая должна быть последовательность действий ?

Добавлено через 10 минут
вот по колхоному, что приходит в голову.

прег_репласе_коллбэк - отдаем весь тег (<a...</a>) некой функ-и.

В некой фун-и делаем другой коллбэк которым меняем или не меняем href. Далее сравниваем изначально принятое значение с текущим (текущее в новой переменной).
если изменилось, то
PHP
1
2
3
If(!preg_match(/target=.../)){
 str_replace('<a ', '<a target="blank"' $var);
}
0
Эксперт PHP
 Аватар для Fedor Vlasenko
936 / 693 / 236
Регистрация: 01.02.2015
Сообщений: 1,848
18.03.2016, 22:31
53ifbb,
Плагин для управления ссылками знаете php разберетесь
пару слов линки a можно по разному написать и разные параметры в них обрабатывать
Цитата Сообщение от 53ifbb Посмотреть сообщение
вот по колхоному, что приходит в голову.
прег_репласе_коллбэк - отдаем весь тег (<a...</a>) некой функ-и.
именно так
0
Фрилансер
Эксперт PythonЭксперт JSЭксперт PHP
 Аватар для Azdeman
1871 / 1362 / 604
Регистрация: 12.01.2011
Сообщений: 5,470
18.03.2016, 23:00
Цитата Сообщение от 53ifbb Посмотреть сообщение
в общем я написал фун-ю которая принимает Url и обрабатывает его как нужно. Возвращает новое значение.
Вы же функцию написали , теперь смысла отвечать нет.
0
55 / 55 / 21
Регистрация: 01.03.2016
Сообщений: 594
19.03.2016, 10:27  [ТС]
Цитата Сообщение от Azdeman Посмотреть сообщение
Вы же функцию написали , теперь смысла отвечать нет.
она сейчас принемает только Url, не теги))

Добавлено через 8 минут
Azdeman,
PHP
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
/**
 * Удаляет протокол у ссылок (любой начинающийся на люб. симв. от 2 до 6 и следом двоеточие (слеши не обязательно)).
 *
 * @param string $url Адрес ссылки.
 * @return mixed
 */
function Url($url){
    $url = trim((string)$url);
    return preg_replace('~^\S{2,6}:/?/?~', '', $url);
}
 
/**
 * Проверяет является ли ссылка внутренней.
 *
 * @param string $url Адрес ссылки.
 * @return bool
 */
function IsMainHost( $url ){
    if(preg_match('/^'.preg_quote(Url($_SERVER['HTTP_HOST'])).'/', Url($url))){
        return true;
    }
    return false;
}
 
/**
 * Фильтрация адреса ссылки перед выводом (защищает от XSS).
 *
 * @param string $url Адрес ссылки.
 * @return string
 * @see UrlRender
 */
function SafeUrl($url){
    $url = trim((string)$url);
    if (empty($url)) return '';
    return HtmlChars((string)substr($url, 0, 2048), null, null, true);
}
 
/**
 * @param string $Url Адрес ссылки.
 * @return string
 */
function UrlRender($url){
    $url = trim($url);
    if($url == ''){
        return $url;
    }
    if(preg_match('~^\S{2,6}:/?/?~', $url) && !IsMainHost($url)){
        return "новая ссылка";
    }else{
        return SafeUrl($url);
    }
}
Добавлено через 10 часов 39 минут
Azdeman,
PHP
1
2
3
4
5
6
7
8
9
function RenderTagA($tag){
    $tag2 = preg_replace_callback('?', 'UrlRender', $tag); // <- ЧТО ТУТ ПИСАТЬ, ЧТО БЫ ПЕРЕДАТЬ ТОЛЬКО ЗНАЧЕНИЕ
    if($tag2 != $tag && !preg_match('/ target=/i')){
        $tag2 = str_replace('<a ', '<a target="_blank" ', $tag2);
    }
    return $tag2
}
 
echo preg_replace_callback('/<a .*<\/a>/i', 'RenderTagA', $echo);
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
19.03.2016, 10:27
Помогаю со студенческими работами здесь

PHP функция для замены внешних ссылок
Ребята, помогите пожалста сделать такой скрипт. Есть сайт site.ru Нужно чтобы все внешние ссылки с классом...

Регулярка для поиска значения
Есть строка 'first|second|third' Мне нужно получить 3 первых символа после знака |. Пыталась сделать что-то типа: но безуспешно ...

Регулярка для поиска телефонов
Что то не получается регулярку составить, что бы выдирать телефоны, формат написания которых заранее не известен, т.е могут быть варианты ...

Регулярка для поиска IPEndPoint
пытаюсь такую написать, почему то у него нет метода Parse :( почему вот это не срабатывает? @&quot;{4}\:(\d+)&quot; на вход подается...

Регулярка для поиска номера телефона
Привет ! Сделал такую регулярку: const string myReg1 = @&quot;((\+38|8)?)?(?\d{3}??)?{6,14}&quot;; Она не ловит все варианты...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
12
Ответ Создать тему
Новые блоги и статьи
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост.
Programma_Boinc 28.12.2025
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост. Налог на собак: https:/ / **********/ gallery/ V06K53e Финансовый отчет в Excel: https:/ / **********/ gallery/ bKBkQFf Пост отсюда. . .
Кто-нибудь знает, где можно бесплатно получить настольный компьютер или ноутбук? США.
Programma_Boinc 26.12.2025
Нашел на реддите интересную статью под названием Anyone know where to get a free Desktop or Laptop? Ниже её машинный перевод. После долгих разбирательств я наконец-то вернула себе. . .
Thinkpad X220 Tablet — это лучший бюджетный ноутбук для учёбы, точка.
Programma_Boinc 23.12.2025
Рецензия / Мнение/ Перевод Нашел на реддите интересную статью под названием The Thinkpad X220 Tablet is the best budget school laptop period . Ниже её машинный перевод. Thinkpad X220 Tablet —. . .
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта Симптом: После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
Как объединить две одинаковые БД Access с разными данными
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином. Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов. . . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru