Форум программистов, компьютерный форум, киберфорум
PHP: сети
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.50/18: Рейтинг темы: голосов - 18, средняя оценка - 4.50
26 / 4 / 3
Регистрация: 12.02.2013
Сообщений: 87

Как парсить несколько страниц в одном коде

15.05.2013, 01:42. Показов 3456. Ответов 1
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Здравствуйте, нужно спарсить n-ое количество страниц. Парсить следующую страницу нужно, если на уже спаршенной странице есть ссылка на следующую страницу, если на последней спаршенной странице ссылок нет, скрипт забирает нужные значения с этой страницы и заканчивает работу.
Как реализовать это зацикливание? Я так понимаю нужна рекурсивная функция.
Помогите пожалуйста.
Использую html dom parser.
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
15.05.2013, 01:42
Ответы с готовыми решениями:

Как парсить несколько страниц, используя один файл
Нужно спарсить список сайтов, у которых больше 100 хостов ежедневно. список сайтов размещен на разных страницах, по 10 сайтов на странице....

Как использовать одну и ту же переменную несколько раз в одном коде
подскажите как использовать одну и туже переменную несколько раз в одном коде допустим А

Несколько страниц в одном файле
Недавно смотрел сайт Европы Плюс и обратил внимание на адреса страниц: http://site.ru/index.php?go=Djs&cat=1&dj=8 ...

1
112 / 93 / 15
Регистрация: 03.10.2012
Сообщений: 315
16.05.2013, 11:29
1. Загрузили и распарсили страницу.
2. Вытащили список ссылок.
3. Пошли парсить каждую страницу поссылке (goto 1).

вот только рекурсией это делать не совсем правильно. слишком глубоко уйдете, если ресурс большой. правильней было бы ссылки складывать в массив и парсить то, что попало в массив.
1
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
16.05.2013, 11:29
Помогаю со студенческими работами здесь

В одном файле несколько страниц
И снова мои нелепые вопросы по поводу PHP. Допустим у меня есть PHP файл с формами для отправки информации на другую страницу и с новой...

Можно ли в одном html файле создать несколько веб-страниц?
Доброго времени суток! Подскажите, можно ли в одном html файле создать несколько веб-страниц . То есть на одной странице странице есть...

Как можно парсить ссылки в несколько потоков?
Например, есть текстовый файл с миллионом ссылок. Пользователь указывает определенное число потоков. Допустим, пользователь указал 13...

Как парсить несколько файлов с Python-скриптом?
Всем доброго времени суток. У меня возникла такая проблема и одновременно вопрос. Как парсить несколько файлов с помощью Python-скрипта? ...

Как Парсить несколько одинаковых XML тегов? (BeautifulSoup)
Имеется XML по типу: <players> <player> <level>5</level> <kills>5</kills> <deaths>5</deaths> <assists>7</assists> ...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
2
Ответ Создать тему
Новые блоги и статьи
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта Симптом: После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
Как объединить две одинаковые БД Access с разными данными
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином. Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов. . . .
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
Создание Single Page Application на фреймах
krapotkin 16.11.2025
Статья исключительно для начинающих. Подходы оригинальностью не блещут. В век Веб все очень привыкли к дизайну Single-Page-Application . Быстренько разберем подход "на фреймах". Мы делаем одну. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru