0 / 0 / 0
Регистрация: 20.02.2011
Сообщений: 148

Как вырезать все ссылки со страницы?

29.06.2011, 14:38. Показов 3125. Ответов 5
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
подсажите вытащил се сылки со страницы вот так
$buf=implode('',file($url));

// получем ссылки в массив
preg_match_all('/<[Aa][
]{1}[^>]*[Hh][Rr][Ee][Ff][^=]*=[ ' '
]*([^ ''>
#]+)[^>]*>/',$buf,$url);

// выводим массив на экран
while($i<count($url[1])) { echo $url[1][$i++].'

'; }
но вот результат
$url='http://overclockers.ru/'
/
/lab/
/hardnews/
/softnews/
/games/
/sitenews/
/files/
/cpubase/
как зделать чтобы все сылки были полные?
тоесть с хостом
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
29.06.2011, 14:38
Ответы с готовыми решениями:

Регулярное выражение: вырезать все ссылки в тексте
Здравствуйте. Не могу разобраться с регулярными выражениями... Есть текст: Какой-то текст &lt;a...

Как получить все ссылки со страницы регулярными выражениями?
Здравствуйте, скажите пожалуйста как получить все ссылки со страницы регулярными выражениями? Добавлено через 6 минут &lt;? ...

Вырезать все скрипты из HTML страницы и вернуть обратно
Необходимо вырезать все скрипты из HTML страницы и вернуть обратно. Между этими операциями проходит форматирование кода страницы: убираются...

5
3 / 3 / 6
Регистрация: 20.06.2010
Сообщений: 580
29.06.2011, 15:11
Вручную добавлять.
Что может пхп сделать если в исходнике они идут в виде <a href='/softnews/' class='menu'>новости software</a>.
Так что, все правильно ...
0
0 / 0 / 0
Регистрация: 20.02.2011
Сообщений: 148
29.06.2011, 15:36  [ТС]
а может поделишся идейой как?
0
4 / 4 / 3
Регистрация: 25.05.2009
Сообщений: 2,576
29.06.2011, 22:38
там у индексного файла должно быть стандартное имя, типа: index.php, main.php, index.pl, mainpage.php
вообщем методом тыка можно найти индексный файл, он в каждом каталоге будет один и тот же(скорее всего)!
0
86 / 62 / 69
Регистрация: 15.03.2007
Сообщений: 6,903
30.06.2011, 10:32
2 pehser
Судя по примеру у тебя в переменной $url уже есть имя выкачиваемой страницы. Имя хоста из него можно получить функцией parse_url.
0
0 / 0 / 0
Регистрация: 20.02.2011
Сообщений: 148
30.06.2011, 22:08  [ТС]
ага можно но если сліка начинается с / но веть может быть и просто
тоетсь
$url = 'http://ixbt.com/soft/subtopic.asp?a=0&id=866151&tp=17'
а сылки там
/hardvea
&inedx.php
../mobil
то вот как обработать все такие варианты
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
30.06.2011, 22:08
Помогаю со студенческими работами здесь

Notepad++ как собрать все ссылки со страницы в одну кучу?
Добрый день! Как в Notepad++ можно собрать все ссылки, присутствующие на странице и положить в самый низ? То есть мне нужно записать...

Как получить все ссылки на страницы сайта, которые находятся в выдаче гугл?
Как получить все ссылки на страницы сайта, которые находятся в выдаче гугл? Нужно считывать все ссылки которыые находятся в выдаче у...

Как вырезать часть из кода страницы?
Вот сам код: &lt;div class=&quot;scont&quot;&gt; &lt;div id=&quot;news-id-15014&quot; style=&quot;display:inline;&quot;&gt;&lt;div align=&quot;center&quot;&gt;&lt;!--TBegin--&gt;&lt;a...

Как получить код страницы, после того, как все скрипты данной страницы отработают, и выдадут все результаты?
Добрый день! Хотелось бы узнать, как получить код страницы, после того как все скрипты, данной страницы, отработают и выдадут все...

Ссылки на все страницы на главной
Добрый День! У меня доска объявлений .... 100 страниц ... на главной внизу сразу ссылки на 100 страниц .... вопрос это плохо или...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
6
Ответ Создать тему
Опции темы

Новые блоги и статьи
Валидация и контроль данных табличной части документа перед записью
Maks 22.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа, разработанного в КА2. Задача: контроль и валидация данных табличной части документа перед записью с учетом регламента компании. . .
Отчёт о затраченных материалах за определенный период с макетом печатной формы
Maks 21.04.2026
Отчёт из решения ниже размещён в конфигурации КА2. Задача: разработка отчёта по затраченным материалам за определённый период, с возможностью вывода печатной формы отчёта с шапкой и подвалом. В. . .
Отчёт о спецтехнике находящейся в ремонте
Maks 20.04.2026
Отчёт из решения ниже размещен в конфигурации КА2. Задача: отобразить спецтехнику, которая на данный момент находится в ремонте. Есть нетиповой документ "Заявка на ремонт спецтехники" который. . .
Памятка для бота и "визитка" для читателей "Semantic Universe Layer (Слой семантической вселенной)"
Hrethgir 19.04.2026
Сгенерировано для краткого описания по случаю сборки и компиляции скелета серверного приложения. И пусть после этого скажут, что статьи сгенерированные AI - туфта и не интересно. И это не реклама -. . .
Запрет удаления строк ТЧ документа при определённом условии
Maks 19.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "Аккумуляторы", разработанного в конфигурации КА2. У данного документа есть ТЧ, в которой в зависимости от прав доступа. . .
Модель заражения группы наркоманов
alhaos 17.04.2026
Условия задачи сформулированы тут Суть: - Группа наркоманов из 10 человек. - Только один инфицирован ВИЧ. - Колются одной иглой. - Колются раз в день. - Колются последовательно через. . .
Мысли в слух. Про "навсегда".
kumehtar 16.04.2026
Подумалось тут, что наверное очень глупо использовать во всяких своих установках понятие "навсегда". Это очень сильное понятие, и я только начинаю понимать край его смысла, не смотря на то что давно. . .
My Business CRM
MaGz GoLd 16.04.2026
Всем привет, недавно возникла потребность создать CRM, для личных нужд. Собственно программа предоставляет из себя базу данных клиентов, в которой можно фиксировать звонки, стадии сделки, а также. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru