Форум программистов, компьютерный форум, киберфорум
PHP: сети
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.60/5: Рейтинг темы: голосов - 5, средняя оценка - 4.60
0 / 0 / 0
Регистрация: 10.08.2015
Сообщений: 62

Парсинг сайтов

26.08.2015, 17:20. Показов 999. Ответов 1
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Добрый день, такая ситуация:

делаю парсер нескольких сайтов. парсю с помощью simple_html_dom.php

при открытии сайта берем с нескольких сайтов несколько страниц, потом выбираю оттуда нужную мне инфу и просто загоняю в массив.

т.е. вся нужная мне инфа хранится в массивах
типа:
PHP
1
2
3
4
$info=array();
foreach ($content as $temp){
          push_array($info,$temp->>innertext);
}
потом просто вывожу это где-то на странице.

вопрос:
чую нутром что что-то делаю не так. Получается при каждом открытии сайта идет куча запросов на сайты доноры. И все долго обрабатывается.
Может как-то иначе нужно поступать? хранить в базе данных и переодически обновлять её ?

как вообще это делают грамотные люди ?
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
26.08.2015, 17:20
Ответы с готовыми решениями:

Парсинг сайтов с ограничениями
Добрый день, уважаемые программисты. Опыт работы с PHP низок, но дана задача, которую надо реализовать. Необходимо пропарсить...

Парсинг сайтов
Подскажите пожалуйста как можно парсить сайты с помощью json, webclient и htmlagility. Прочитал множество статей, но там идет упор на XML.

Парсинг сайтов
Здравствуйте, подскажите хорошую библиотеку для парсинга сайтов и желатьльно ссылку на документацию, заранее спасибо!

1
 Аватар для alexsamos33
669 / 640 / 335
Регистрация: 26.04.2014
Сообщений: 2,122
27.08.2015, 07:28
Ну да. Можно для ускорения при первом запросе сохранить все данные у себя и при последующих запросах брать данные уже сохранённые. Потом через какое-то время опять заново сохранить...
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
27.08.2015, 07:28
Помогаю со студенческими работами здесь

парсинг сайтов
Здравствуйте форумчане, у меня вопрос,к примеру есть сайт wday.ru, мне нужно спарсить все новости во всех разделах ../moda-shopping/.. и...

Парсинг динамических сайтов
Всем привет! Ищу способы получения HTML кода сайтов которые подгружают данные путем javascript-a. Стандартные способы webrequest,...

Парсинг русских сайтов
Здравствуйте! Я учусь парсить сайты. На примере википедии. Возникла проблема: когда запускаю для английской википедии, всё хорошо. А когда...

Парсинг сайтов на Python
Всем привет. В программировании новичок. Появилась необходимость спарсить страничку Пробовал через BeautifulSoup. Получился такой код: ...

Парсинг данных с сайтов
Доброго времени суток! Проблема в том, что некоторые сайты запрещают автоматически парсить свои страницы, например yandex выдает капчу,...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
2
Ответ Создать тему
Новые блоги и статьи
Подстановка значения реквизита справочника в табличную часть документа
Maks 10.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "ПланированиеПерсонала", разработанного в конфигурации КА2. Задача: при выборе сотрудника (справочник Сотрудники) в ТЧ документа. . .
Очистка реквизитов документа при копировании
Maks 09.04.2026
Алгоритм из решения ниже применим как для типовых, так и для нетиповых документов на самых различных конфигурациях. Задача: при копировании документа очищать определенные реквизиты и табличную. . .
модель ЗдравоСохранения 8. Подготовка к разному выполнению заданий
anaschu 08.04.2026
https:/ / github. com/ shumilovas/ med2. git main ветка * содержимое блока дэлэй из старой модели теперь внутри зайца новой модели 8ATzM_2aurI
Блокировка документа от изменений, если он открыт у другого пользователя
Maks 08.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа, разработанного в конфигурации КА2. Задача: запретить редактирование документа, если он открыт у другого пользователя. / / . . .
Система безопасности+живучести для сервера-слоя интернета (сети). Двойная привязка.
Hrethgir 08.04.2026
Далее были размышления о системе безопасности. Сообщения с наклонным текстом - мои. А как нам будет можно проверить, что ссылка наша, а не подделана хулиганами, которая выбросит на другую ветку и. . .
Модель ЗдрввоСохранения 7: больше работников, больше ресурсов.
anaschu 08.04.2026
работников и заданий может быть сколько угодно, но настроено всё так, что используется пока что только 20% kYBz3eJf3jQ
Дальние перспективы сервера - слоя сети с космологическим дизайном интефейса карты и логики.
Hrethgir 07.04.2026
Дальнейшее ближайшее планирование вывело к размышлениям над дальними перспективами. И вот тут может быть даже будут нужны оценки специалистов, так как в дальних перспективах всё может очень сильно. . .
Горе от ума
kumehtar 07.04.2026
Эта мне ментальная установка, что вот прямо сейчас, мол, мне для полного счастья не хватает (нужное вписать), и когда я этого достигну - тогда и полный кайф. Одна из самых сильных ловушек на пути. . . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru