Форум программистов, компьютерный форум, киберфорум
PHP для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.80/5: Рейтинг темы: голосов - 5, средняя оценка - 4.80
383 / 23 / 2
Регистрация: 12.06.2021
Сообщений: 211
Записей в блоге: 2

Как распарсить ссылку используя регулярные выражения, извлечь протоколы https или http для условия?

30.11.2021, 15:21. Показов 1010. Ответов 8
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
У меня есть код в котором строка проверяется по домену, таким образом я определяю является ссылка с yandex disk или это мой файл расположенный на хосте и соответственно скачивание происходит или с моего сайта или с yandex. Не давно yandex внес изменения поменяв название своего диска, теперь вместо этого
https://yadi.sk/d/54FLEQEsHf6RrA
Вот это:
https://disk.yandex.ru/d/54FLEQEsHf6RrA

Соответственно мой код пришел в негодность. Тут я решила делать проверку по протоколу https или http. В основном скачивание делаю с яндекса, но использовав протоколы в условиях я расширю список сайтов от куда могут скачивать например cloud mail ru, Google Диск, Mega, Dropbox, pCloud и другие облака.

Как распарсить ссылку с помощью регулярных выражений и извлечь протоколы https и http, а потом сделать проверку и выдать то условие в зависимости встречается протокол или нет. Вот изначальный код.

PHP
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
    $filename = "https://disk.yandex.ru/d/54FLEQEsHf6RrA";
 
    preg_match('@^(?:https://)?([^/]+)@i', "$filename", $matches);
    $host = $matches[1];
    
    preg_match('/[^.]+\.[^.]+$/', $host, $matches);
   
    if($matches[0]=="yadi.sk" || $matches[0]=="yandex.ru")
    {
      //header("Location: ".$filename);
      $url = "https://yandex.ru/";
    }
    else
    {
       $url = "file.rar";
    }
    echo $url;
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
30.11.2021, 15:21
Ответы с готовыми решениями:

Как распарсить строки, используя регулярные выражения
Здравствуйте. есть небольшая проблема, с парсингом через регулярные выражения, в общем, нужно отпарсить выражение: VAR a,b,c; ...

Как распарсить строку на токены используя регулярные выражения
Здравствуйте!Надо распарсить строку такую например "set int MyVar=7" чтобы получились лексемы(токены) token=set и соответственно...

На каком языке программирования создаются сетевые протоколы HTTP, HTTPS, FTP, UDP, IP, IP SEc, и другие протоколы
Просто очень интересно

8
Эксперт PHP
3899 / 3237 / 1353
Регистрация: 01.08.2012
Сообщений: 10,904
30.11.2021, 15:35
https://www.php.net/manual/ru/... se-url.php
0
Супер-модератор
Эксперт JSЭксперт HTML/CSSЭксперт PHP
 Аватар для gogolik
3941 / 2045 / 829
Регистрация: 13.03.2010
Сообщений: 6,727
30.11.2021, 17:14
Цитата Сообщение от Olga28 Посмотреть сообщение
https://yadi.sk/d/54FLEQEsHf6RrA
Но ссылки такого формата тоже работают.
0
383 / 23 / 2
Регистрация: 12.06.2021
Сообщений: 211
Записей в блоге: 2
30.11.2021, 19:20  [ТС]
Вот еще вариант нашла, работает:

PHP
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
preg_match("/^(http|https):\/\/*/i",
     $url, $matches);
$host = $matches[0];
 
 
 
if($host=="http://" || $host=="https://")
{
    $url = "https://yadi.sk/d/54FLEQEsHf6RrA";
}
else
{
    $url = $url;
}
echo $url;
0
3 / 2 / 2
Регистрация: 14.03.2015
Сообщений: 168
30.11.2021, 19:35
Olga28, вам правильно подсказал Jodah, в php уже есть функция parse_url, которая разбивает URL на составляющие:

PHP
1
2
3
4
5
6
7
8
9
10
$filename = "https://disk.yandex.ru/d/54FLEQEsHf6RrA";
$parse_url = parse_url($filename);
 
Result:
Array
(
    [scheme] => https
    [host] => disk.yandex.ru
    [path] => /d/54FLEQEsHf6RrA
)
Как видно, хост лежит в $parse_url['host'] и дальше можно валидировать его.

Здесь не нужно использовать регулярные выражения, лучше стараться избегать их в принципе.
0
383 / 23 / 2
Регистрация: 12.06.2021
Сообщений: 211
Записей в блоге: 2
30.11.2021, 19:37  [ТС]
Здесь не нужно использовать регулярные выражения, лучше стараться избегать их в принципе.
Ну а если мне нужно сделать bbcode, как тогда обойтись без регулярных выражений?
0
3 / 2 / 2
Регистрация: 14.03.2015
Сообщений: 168
30.11.2021, 19:52
Цитата Сообщение от Olga28 Посмотреть сообщение
Ну а если мне нужно сделать bbcode, как тогда обойтись без регулярных выражений?
bbcode для чего? Проблема в том чтобы достать ссылку из текста или в том чтобы валидировать саму ссылку?
0
Невнимательный
 Аватар для ft4l
2840 / 1266 / 358
Регистрация: 08.02.2013
Сообщений: 7,367
Записей в блоге: 2
30.11.2021, 20:41
Цитата Сообщение от Olga28 Посмотреть сообщение
PHP
1
2
3
    $filename = "https://disk.yandex.ru/d/54FLEQEsHf6RrA";
 
    preg_match('@^(?:https://)?([^/]+)@i', "$filename", $matches);
Цитата Сообщение от Olga28 Посмотреть сообщение
bbcode
Если ^ в начале то это будет искать только в начале строки.
Если по всему тексту то \b(граница слова) наверно в начале.
Но ссылки-же и без http:// хотите тоже ),
а в тексте такого может быть много чего и простое [^/]+ уже никак.
Оно будет грести всё что попало
PHP
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
$txt = 'https://
disk
HTTP://сайт.рф';
$re = '@\b(?:(https?)://)?\K[^\s/]+@i';
if (preg_match_all($re, $txt,  $m, PREG_SET_ORDER)) {
    echo "<pre>\n", var_export($m,  1), "\n</pre>";
}/*
<pre>
array (
  0 =>
  array (
    0 => 'https:',
  ),
  1 =>
  array (
    0 => 'disk',
  ),
  2 =>
  array (
    0 => 'сайт.рф',
    1 => 'HTTP',
  ),
)
</pre>*/
Даже посерьёзнее такое выражение будет грести всякие имена файлов ,
типа configure.com makefile.pl даже только с поддежкой латинических доменов

Добавлено через 5 минут
Цитата Сообщение от ft4l Посмотреть сообщение
makefile.pl
оказывается и домен тоже ))
configure.com продаётся )
0
383 / 23 / 2
Регистрация: 12.06.2021
Сообщений: 211
Записей в блоге: 2
01.12.2021, 16:17  [ТС]
bbcode для чего? Проблема в том чтобы достать ссылку из текста или в том чтобы валидировать саму ссылку?
Для форума. Например cyberforum использует bbcode при добавлении поста.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
01.12.2021, 16:17
Помогаю со студенческими работами здесь

Распарсить строку используя регулярные выражения
Нужно получить каждое значение из строки 94031240 Подвеска (Фианит //1,67 г./Родирование/9167000836327) как это сделать с...

Распарсить страницу, используя регулярные выражения
Здравствуйте. Вопрос такой: в программу приходит ответ от сайта: &lt;img width=&quot;12&quot; height=&quot;12&quot;...

Распарсить текст, используя рекурсию и регулярные выражения
Всем доброго времени суток! Нужна помощью в написании регулярного выражения, с использованием рекурсии. Имеется строка: ...

Используя регулярные выражения извлечь из текста html-файла все ссылки
Извлеките из текста html-файла все ссылки (всё, что содержится в шаблоне &lt;a href=’…’&gt;)* * Для работы с html запросами используйте...

Используя регулярные выражения, извлечь из строки и напечатать в порядке появления цены в долларах
Помогите решить заду. Дана строка S. Используя регулярные выражения, извлечь из строки и напечатать в порядке появления: Цены в...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
9
Ответ Создать тему
Новые блоги и статьи
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта Симптом: После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
Как объединить две одинаковые БД Access с разными данными
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином. Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов. . . .
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
Создание Single Page Application на фреймах
krapotkin 16.11.2025
Статья исключительно для начинающих. Подходы оригинальностью не блещут. В век Веб все очень привыкли к дизайну Single-Page-Application . Быстренько разберем подход "на фреймах". Мы делаем одну. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru