Форум программистов, компьютерный форум, киберфорум
PHP для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 5.00/8: Рейтинг темы: голосов - 8, средняя оценка - 5.00
0 / 0 / 0
Регистрация: 17.03.2010
Сообщений: 13

Рекурсия. Подскажите, как доработать?

31.05.2010, 20:14. Показов 1623. Ответов 1
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Здравствуйте! Возникла проблема: нужно написать функцию, которая получает на вход ссылку на страницу, и на выходе возвращает массив всех внутренних ссылок всего сайта, т.е. она выцепляет все ссылки на другие страницы этого сайта(другие не трогает!), идет по ним и там делает то же самое, а результат помещает в файл, после чего все данные из файла считываются в массив
Я написал вот такой код, он пока что выцепляет ссылки только со входной страницы и записывает их в файл. Проблема в том, как сделать так, чтобы эта же функция потом рекурсивно получала на вход ссылки из этого файла и дозаписывала в него новые.
PHP
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
<?php 
function UrlArray($adress)
{
    // получаем www-адрес (имя хоста) из url
    $url = "$adress";
    preg_match("/^(http:\/\/)?([^\/]+)/i", $url, $matches);
    $host = $matches[2];
    // получаем последние два сегмента имени хоста (доменное имя)
    preg_match("/[^\.\/]+\.[^\.\/]+$/", $host, $matches);
    $dom_name=$matches[0];
        //Регулярное выражение для поиска внутренних ссылок
    $reg_vir="#(https?|ftp)://\S+\.".$dom_name."\S+[^\s.,>)\];'\"!?]#m";
    $page=file_get_contents($adress);  
    preg_match_all($reg_vir,$page,$out,PREG_PATTERN_ORDER);
    $i=0;
        //пробегаем массив ссылок и дозаписываем их  в файл
    while($out[0][$i]!=null)
    {
        $f=fopen("links.txt","a+") or die("Ошибка!");
        fwrite($f,$out[0][$i]."\r\n"); 
        fclose($f); 
        $i++;
    }
 
}
?>
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
31.05.2010, 20:14
Ответы с готовыми решениями:

Подскажите, как доработать функцию ресайза изображений
Есть функция, для ресайза изображений. Как довести ее до ума, задача такая: $w_i - это ширина исходного изображения, а $h_i - высота. ...

Rss персер на php подскажите как доработать
Здравствуйте уважаемые пользователи! Долго искал хороший персер, и все таки надеюсь нашел, но он не все выводит, а знаний подправить его...

Подскажите как доработать код
Нужно посчитать копейки. от 1-й до 99-ти. Суть в том что бы посчитать в порядке 1-копейка, 2,3,4-копейки, 5-20-копеек, 21-копейка,...

1
33 / 33 / 12
Регистрация: 18.05.2010
Сообщений: 99
01.06.2010, 20:49
PHP
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
function UrlArray($adress, $level = 0)
{
        // получаем www-адрес (имя хоста) из url
        $url = "$adress";
        preg_match("/^(http:\/\/)?([^\/]+)/i", $url, $matches);
        $host = $matches[2];
        // получаем последние два сегмента имени хоста (доменное имя)
        preg_match("/[^\.\/]+\.[^\.\/]+$/", $host, $matches);
        $dom_name=$matches[0];
        //Регулярное выражение для поиска внутренних ссылок
        $reg_vir="#(https?|ftp)://\S+\.".$dom_name."\S+[^\s.,>)\];'\"!?]#m";
        $page=file_get_contents($adress);  
        preg_match_all($reg_vir,$page,$out,PREG_PATTERN_ORDER);
        $i=0;
        //пробегаем массив ссылок и дозаписываем их  в файл
        $f=fopen("links.txt","a+") or die("Ошибка!");
        while($out[0][$i]!=null)
        {                
                fwrite($f,$out[0][$i]."\r\n"); 
                if ($level < 20) //Максимальный уровень вложенности, также поможет в случае зацикливания.
                {
                     UrlArray($out[0][$i], $level +1);
                }
                $i++;
        }
        fclose($f); 
 
}
?>
Как-то так... однако, перед тем, как открывать очередную страницу, следует организовать проверку не была ли она уже обработана. Иначе функция может зациклиться, т.к. на ней может оказаться ссылка на ту страницу, где вы уже побывали... вот вам и бесконечная рекурсия Проверка $level'a помогает лишь предотваратить бесконечное выполнение алгоритма.

P.S. И почему бы не записать
Perl
1
#^([url]http://)?([/url][^/]+)#i
вместо
Perl
1
/^(http:\/\/)?([^\/]+)/i ?
Ведь куда симпатичнее выглядит

P.S.S И файл открывать\закрывать надо за пределами цикла, а то зачем лишние накладные расходы?
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
01.06.2010, 20:49
Помогаю со студенческими работами здесь

Подскажите, как доработать обработку
Добрый день, Уважаемые товарищи. На основе некой обработки, взятой с просторов интернета, переделав её под себя ,столкнулся с тем, что.....

Подскажите как доработать бегущую строку
Все привет. Имеется код простой бегущей строки, движение снизу-вверх. Подскажите, как исправить этот код так, чтобы при обновлении страницы...

Подскажите, пожалуйста, как доработать код под ЛистБокс
При поочередной обработке файлов в ListBox остается текстовая выборка из последнего файла (она же сохраняется в файл). Подскажите, как в...

Подскажите как доработать отсчет времени до Нового Года
Все привет! Есть отсчет времени до нового года. &lt;script&gt; var now = new Date(); var ny = Math.floor(now.getTime() /...

Подскажите, как доработать программу на Lisp с использованием базовых примитивов
Запрограммируйте интерпретатор ВЫЧИСЛИ, который преобразует инфиксную запись операций (например, +, -, * и /) выражения в префиксную и...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
2
Ответ Создать тему
Новые блоги и статьи
Инструменты COM: Сохранение данный из VARIANT в файл и загрузка из файла в VARIANT
bedvit 28.01.2026
Сохранение базовых типов COM и массивов (одномерных или двухмерных) любой вложенности (деревья) в файл, с возможностью выбора алгоритмов сжатия и шифрования. Часть библиотеки BedvitCOM Использованы. . .
Загрузка PNG с альфа-каналом на SDL3 для Android: с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 28.01.2026
Содержание блога SDL3 имеет собственные средства для загрузки и отображения PNG-файлов с альфа-каналом и базовой работы с ними. В этой инструкции используется функция SDL_LoadPNG(), которая. . .
Загрузка PNG с альфа-каналом на SDL3 для Android: с помощью SDL3_image
8Observer8 27.01.2026
Содержание блога SDL3_image - это библиотека для загрузки и работы с изображениями. Эта пошаговая инструкция покажет, как загрузить и вывести на экран смартфона картинку с альфа-каналом, то есть с. . .
Влияние грибов на сукцессию
anaschu 26.01.2026
Бифуркационные изменения массы гриба происходят тогда, когда мы уменьшаем массу компоста в 10 раз, а скорость прироста биомассы уменьшаем в три раза. Скорость прироста биомассы может уменьшаться за. . .
Воспроизведение звукового файла с помощью SDL3_mixer при касании экрана Android
8Observer8 26.01.2026
Содержание блога SDL3_mixer - это библиотека я для воспроизведения аудио. В отличие от инструкции по добавлению текста код по проигрыванию звука уже содержится в шаблоне примера. Нужно только. . .
Установка Android SDK, NDK, JDK, CMake и т.д.
8Observer8 25.01.2026
Содержание блога Перейдите по ссылке: https:/ / developer. android. com/ studio и в самом низу страницы кликните по архиву "commandlinetools-win-xxxxxx_latest. zip" Извлеките архив и вы увидите. . .
Вывод текста со шрифтом TTF на Android с помощью библиотеки SDL3_ttf
8Observer8 25.01.2026
Содержание блога Если у вас не установлены Android SDK, NDK, JDK, и т. д. то сделайте это по следующей инструкции: Установка Android SDK, NDK, JDK, CMake и т. д. Сборка примера Скачайте. . .
Использование SDL3-callbacks вместо функции main() на Android, Desktop и WebAssembly
8Observer8 24.01.2026
Содержание блога Если вы откроете примеры для начинающих на официальном репозитории SDL3 в папке: examples, то вы увидите, что все примеры используют следующие четыре обязательные функции, а. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru