|
0 / 0 / 0
Регистрация: 18.02.2016
Сообщений: 3
|
||||||
Requests парсит не ту страницу27.02.2019, 13:21. Показов 3942. Ответов 4
Метки нет (Все метки)
Добрый день. Подскажите пожалуййста, в чем может быть ошибка при парсинге сайта. Использую requests, но он парсит только одну страницу, да и то, котороую я не передаю. Заранее благодарен за помощь.
0
|
||||||
| 27.02.2019, 13:21 | |
|
Ответы с готовыми решениями:
4
BeautifulSoup не парсит страницу до конца Парсит только 1 страницу из steam Почему bs4 неверно парсит страницу? |
|
49 / 21 / 6
Регистрация: 16.02.2019
Сообщений: 55
|
|
| 27.02.2019, 14:14 | |
|
Так вы этот сайт не спарсите.
Потому что у вас логика не правильная. Там нужно установить куку в которой будет записано что вы нажали кнопку "мне 18 лет" Для этого нужно сделать дополнительный запрос перед парсингом.
0
|
|
|
0 / 0 / 0
Регистрация: 18.02.2016
Сообщений: 3
|
|
| 27.02.2019, 14:19 [ТС] | |
|
Так дело в том, что он парсит только эту страницу https://altavina.ru/catalog/wine/ . Мне она конечно тоже нужна, ну я хочу перейти на следующие страницы, однако этого не происходит. Все время использует только эту страницу.
0
|
|
|
49 / 21 / 6
Регистрация: 16.02.2019
Сообщений: 55
|
|||||||||||
| 27.02.2019, 14:36 | |||||||||||
Сообщение было отмечено Gumer1 как решение
Решение
я вам уже написал, почему сайт не отдает последующие страницы.
Попробуйте взять какой нибудь отладочный прокси(Fiddler например, или Burpl Suite), и посмотрbnt через него запросы, предварительно очистив все куки в вашем браузере. Для парсинга я бы не стал использовать requests. Есть например Scrapy. Добавлено через 13 минут Добавьте такую куку и должно начать работать как вы ожидаете:
0
|
|||||||||||
|
0 / 0 / 0
Регистрация: 18.02.2016
Сообщений: 3
|
|
| 27.02.2019, 15:31 [ТС] | |
|
Спасибо большое. Оказывается при вызове страницы, она перекидывала на начальную страницу, но ваш ответ подтолкнул к решению
0
|
|
| 27.02.2019, 15:31 | |
|
Помогаю со студенческими работами здесь
5
Requests искажает получаемую html страницу Не парсит страницу сайта PhpQuery парсит страницу в другой кодировке Добавил модуль requests в Visual Studio, но import requests подсвечен зеленым Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
Архитектура слоя интернета для сервера-слоя.
Hrethgir 11.04.2026
В продолжение https:/ / www. cyberforum. ru/ blogs/ 223907/ 10860. html
Знаешь что я подумал? Раз мы все источники пишем в голове ветки, то ничего не мешает добавить в голову такой источник, который сам. . .
|
Подстановка значения реквизита справочника в табличную часть документа
Maks 10.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "ПланированиеПерсонала", разработанного в конфигурации КА2.
Задача: при выборе сотрудника (справочник Сотрудники) в ТЧ документа. . .
|
Очистка реквизитов документа при копировании
Maks 09.04.2026
Алгоритм из решения ниже применим как для типовых, так и для нетиповых документов на самых различных конфигурациях.
Задача: при копировании документа очищать определенные реквизиты и табличную. . .
|
модель ЗдравоСохранения 8. Подготовка к разному выполнению заданий
anaschu 08.04.2026
https:/ / github. com/ shumilovas/ med2. git
main ветка * содержимое блока дэлэй из старой модели теперь внутри зайца новой модели
8ATzM_2aurI
|
|
Блокировка документа от изменений, если он открыт у другого пользователя
Maks 08.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа, разработанного в конфигурации КА2.
Задача: запретить редактирование документа, если он открыт у другого пользователя.
/ / . . .
|
Система безопасности+живучести для сервера-слоя интернета (сети). Двойная привязка.
Hrethgir 08.04.2026
Далее были размышления о системе безопасности. Сообщения с наклонным текстом - мои.
А как нам будет можно проверить, что ссылка наша, а не подделана хулиганами, которая выбросит на другую ветку и. . .
|
Модель ЗдрввоСохранения 7: больше работников, больше ресурсов.
anaschu 08.04.2026
работников и заданий может быть сколько угодно, но настроено всё так, что используется пока что только 20%
kYBz3eJf3jQ
|
Дальние перспективы сервера - слоя сети с космологическим дизайном интефейса карты и логики.
Hrethgir 07.04.2026
Дальнейшее ближайшее планирование вывело к размышлениям над дальними перспективами. И вот тут может быть даже будут нужны оценки специалистов, так как в дальних перспективах всё может очень сильно. . .
|