Форум программистов, компьютерный форум, киберфорум
C# для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.80/5: Рейтинг темы: голосов - 5, средняя оценка - 4.80
0 / 0 / 0
Регистрация: 27.04.2012
Сообщений: 26

Как избежать блокирование парсера сайта?

19.08.2013, 14:00. Показов 1073. Ответов 4
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Пишу довольно простой парсер. Основная проблема - сайт довольно быстро его распознает и блокирует где-то на час по ip.
Пробовал подставлять прокси, но большинство их у него в ЧС, похоже.
Теперь пытаюсь подобрать задержку между отправкой запросов, т.к. важно не время, а результат.
Подскажите пожалуйста, сколько примерно запросов в минуту можно отправлять, не опасаясь бана?
0
Лучшие ответы (1)
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
19.08.2013, 14:00
Ответы с готовыми решениями:

Настройка сайта на блокирование несуществующих URL
Столкнулся с проблемой при настройке Getsimple, при престыковке мусора типа "?ххххххх" к основным директориям не происходит пере...

Получить данные с сайта для простого парсера
Всем доброго времени суток. Мне нужно получить курс доллара с сайта (https://finance.rambler.ru/). Взял чисто для примера -...

Написание парсера для сайта, структура которого подгружается javascript
Здравствуйте, попытался использовать Beautiful Soup, приходит ответ, в котором все элементы в body - являются javascript'ом. Как парсить...

4
 Аватар для n1l
136 / 138 / 18
Регистрация: 26.07.2010
Сообщений: 911
19.08.2013, 14:08
А вы точно уверены, что вас блокирует сайт?
Может быть вы просто соединение не разорвали от предыдущего запроса?
0
0 / 0 / 0
Регистрация: 27.04.2012
Сообщений: 26
19.08.2013, 16:53  [ТС]
Цитата Сообщение от n1l Посмотреть сообщение
А вы точно уверены, что вас блокирует сайт?
Может быть вы просто соединение не разорвали от предыдущего запроса?
Точно сайт. Доступ закрывается где-то после сотни запросов.
0
14 / 14 / 9
Регистрация: 22.11.2012
Сообщений: 62
19.08.2013, 16:59
Лучший ответ Сообщение было отмечено tezaurismosis как решение

Решение

Цитата Сообщение от Jakob Посмотреть сообщение
Пишу довольно простой парсер. Основная проблема - сайт довольно быстро его распознает и блокирует где-то на час по ip.
Пробовал подставлять прокси, но большинство их у него в ЧС, похоже.
Теперь пытаюсь подобрать задержку между отправкой запросов, т.к. важно не время, а результат.
Подскажите пожалуйста, сколько примерно запросов в минуту можно отправлять, не опасаясь бана?
Скорей всего ваши прокси просто дохлые...берите список проксей и гоняйте в многопотоке...
И еще меняйте юзерагента. Даже если с разных ip вы будете делать запрос с одними и теме же параметрами(юзерагент, раскладка и т.д.) Сайт быстро забанит за возможную ddos атаку
0
0 / 0 / 0
Регистрация: 27.04.2012
Сообщений: 26
19.08.2013, 17:19  [ТС]
Цитата Сообщение от onfrich Посмотреть сообщение
Скорей всего ваши прокси просто дохлые...берите список проксей и гоняйте в многопотоке...
И еще меняйте юзерагента. Даже если с разных ip вы будете делать запрос с одними и теме же параметрами(юзерагент, раскладка и т.д.) Сайт быстро забанит за возможную ddos атаку
Хорошо попробую так, спасибо.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
19.08.2013, 17:19
Помогаю со студенческими работами здесь

Как сделать блокирование одной клавиши?
Здравствуйте, у меня задача, мне нужно чтобы программа при нажатии Left Shift + Left Ctrl + F2 блокировала нажатие кнопки 2 - чтобы её...

Google reCAPTCHA как защита от парсера
Уважаемые форумчане, подскажите пожалуйста. Как вы думаете, если парсер ворует контент на сайте, можно ли сделать проверку при помощи...

Не понятно как работает код парсера
Здравствуйте, уважаемые форумчане:) Решил разобраться и написать простенький парсер. Застрял на этапе, когда нужно из скачанной...

Как изменить поведение GSON парсера?
Доброго дня. Есть JSON, которым с помощью GSON заполняется модель, создаю экземпляр класса. В JSON'е есть поле "field1", это...

Как исправить ошибку в коде RSS-парсера
Доброго всем времени суток . Дали задание написать парсер для rss . Но всё да былобы , но выдаёт ошибку "Имя MyResponse и...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
5
Ответ Создать тему
Новые блоги и статьи
Модульный подход на примере F#
DevAlt 06.03.2026
В блоге дяди Боба наткнулся на такое определение: В этой книге («Подход, основанный на вариантах использования») Ивар утверждает, что архитектура программного обеспечения — это структуры,. . .
Управление камерой с помощью скрипта OrbitControls.js на Three.js: Вращение, зум и панорамирование
8Observer8 05.03.2026
Содержание блога Финальная демка в браузере работает на Desktop и мобильных браузерах. Итоговый код: orbit-controls-threejs-js. zip. Сканируйте QR-код на мобильном. Вращайте камеру одним пальцем,. . .
SDL3 для Web (WebAssembly): Синхронизация спрайтов SDL3 и тел Box2D
8Observer8 04.03.2026
Содержание блога Финальная демка в браузере. Итоговый код: finish-sync-physics-sprites-sdl3-c. zip На первой гифке отладочные линии отключены, а на второй включены:. . .
SDL3 для Web (WebAssembly): Идентификация объектов на Box2D v3 - использование userData и событий коллизий
8Observer8 02.03.2026
Содержание блога Финальная демка в браузере. Итоговый код: finish-collision-events-sdl3-c. zip Сканируйте QR-код на мобильном и вы увидите, что появится джойстик для управления главным героем. . . .
Реалии
Hrethgir 01.03.2026
Нет, я не закончил до сих пор симулятор. Эта задача сложнее. Не получилось уйти в плавсостав, но оно и к лучшему, возможно. Точнее получалось - но сварщиком в палубную команду, а это значит, в моём. . .
Ритм жизни
kumehtar 27.02.2026
Иногда приходится жить в ритме, где дел становится всё больше, а вовлечения в происходящее — всё меньше. Плотный график не даёт вниманию закрепиться ни на одном событии. Утро начинается с быстрых,. . .
SDL3 для Web (WebAssembly): Сборка библиотек: SDL3, Box2D, FreeType, SDL3_ttf, SDL3_mixer и SDL3_image из исходников с помощью CMake и Emscripten
8Observer8 27.02.2026
Недавно вышла версия 3. 4. 2 библиотеки SDL3. На странице официальной релиза доступны исходники, готовые DLL (для x86, x64, arm64), а также библиотеки для разработки под Android, MinGW и Visual Studio. . . .
SDL3 для Web (WebAssembly): Реализация движения на Box2D v3 - трение и коллизии с повёрнутыми стенами
8Observer8 20.02.2026
Содержание блога Box2D позволяет легко создать главного героя, который не проходит сквозь стены и перемещается с заданным трением о препятствия, которые можно располагать под углом, как верхнее. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru