|
0 / 0 / 0
Регистрация: 08.06.2015
Сообщений: 38
|
||||||||||||||||
Зайти в сессию с requests и продолжить парсинг уже с Selenium16.11.2020, 09:45. Показов 13931. Ответов 18
Добрый день, совсем запуталась с решением задачи:
необходимо скачать картинки с нескольких страниц в одном разделе сайта (validate). На просторах интернета я нашла решение для скачивания и сохранения картинок с другого раздела сайта (classes) - всё хорошо работает. Вхожу с requests, далее обрабатываю с soup, поиск по тэгу img.
Но это не сработало с другим разделом сайта, где идет динамическая загрузка страницы, у меня не получается сохранить данные по входу в сессию, при попытке перейти на этот раздел, в коде страницы я вижу только код по вводу логина (стартовая страница). Я пробовала зайти с selenium_requests, чтобы дальше обрабатывать с selenium, но это не вышло. Так же думала как-то открыть динамическую страницу в данной сессии, но решения для этого не нашла. Это то, что я пробовала:
0
|
||||||||||||||||
| 16.11.2020, 09:45 | |
|
Ответы с готовыми решениями:
18
Python Selenium/Requests
Как продолжить действия с той же вкладкой Selenium? |
|
Автоматизируй это!
|
||
| 16.11.2020, 09:56 | ||
|
так используй обычный селениум -заходи на логин страницу, вводи поля и так далее, без реквестов и соуп. Если уж поднимать весь браузер то тогда запросы и парсер не нужны, селениум сам все умеет.
Добавлено через 2 минуты после клика авторизации дождись перехода на страницу, чтобы убедиться что авторизовалось, только потом переходи на нужный линк
1
|
||
|
0 / 0 / 0
Регистрация: 08.06.2015
Сообщений: 38
|
||||||
| 16.11.2020, 09:57 [ТС] | ||||||
|
у меня тоже не вышло, я думала, Что это из-за того, что в форму ещё передается hidden "_csrf-markup"
я не смогла это никак в Selenium передать, а так он не заходил, насколько уже помню(
0
|
||||||
|
0 / 0 / 0
Регистрация: 08.06.2015
Сообщений: 38
|
|||||||||||
| 19.11.2020, 07:20 [ТС] | |||||||||||
|
пока не выходит - вышло единожды!.. и я обрадовалась увидев знакомые кучу img, но когда я решила обработать этот код и доставать картинки, всё сломалось, хотя я не меняла ничего..
что я понимаю из кода странички, что вход почему-то не осуществлен - это моя догадка( я пыталась так же нажать на элемент на странице с Селениум (в комментах видны куски кода) - не выходит тоже)
что я вижу в итоге:
0
|
|||||||||||
|
0 / 0 / 0
Регистрация: 08.06.2015
Сообщений: 38
|
||||||||||||||||
| 19.11.2020, 09:42 [ТС] | ||||||||||||||||
|
да, он логин вводит и пароль, а потом его опять выбрасывает на страницу логин, как будто и не было логина.. может после клика подождать попросить.. (ожидание добавила, всё равно, в форму всё введено, но не логинится (может всё-таки в этом markup дело( в форме - полезная нагрузка запроса?
0
|
||||||||||||||||
|
Автоматизируй это!
|
||||||
| 19.12.2020, 11:26 | ||||||
0
|
||||||
|
|
|||||||
| 19.12.2020, 15:45 | |||||||
|
lxml позволяет работать напрямую с формами.
0
|
|||||||
|
0 / 0 / 0
Регистрация: 08.06.2015
Сообщений: 38
|
||||||
| 19.12.2020, 16:02 [ТС] | ||||||
|
а lxml поможет с динамическими страницами?
@Welemir1 помог с авторизацией на сайте - я теперь поняла, почему меня выкидывало (после get(логин_страница) я вызывала get(ревизия_страница) и меня выкидывало вновь) Пока не могу это решить, я уже даже стала основной страницей делать не логин страницу, а нужный раздел сайта, и я туда захожу, НО далее надо выбрать значение из выпадающего списка, чтобы отсортировать картинки на сайте (на текущий момент открыть напрямую страницу с нужным class_id не удалось).. я думаю как вариант попробовать остаться в сессии селениум, пока не понимаю как)
0
|
||||||
|
|
||
| 19.12.2020, 16:09 | ||
|
А все прочее можно получать через AJAX запросы.
1
|
||
|
0 / 0 / 0
Регистрация: 08.06.2015
Сообщений: 38
|
|
| 19.12.2020, 16:18 [ТС] | |
|
Спасибо! Почитаю про них!
0
|
|
|
|
||
| 19.12.2020, 16:31 | ||
|
AJAX запросы нужно уметь видеть в браузерных тулзах для разработчика и генерировать точно такие же. Многие динамические странички это просто AJAX запросы к серверу, который присылает json-чик с данными. Хотя, конечно, если страничка вся построена чисто на браузерном javascript, то с этим уже без эмуляции браузера никак не справиться.
0
|
||
|
0 / 0 / 0
Регистрация: 08.06.2015
Сообщений: 38
|
|
| 19.12.2020, 17:29 [ТС] | |
|
думаю, что да, JS
прилагаю принскрины. дело в том, что у меня открывается нужная страница после логина (то есть я сразу открываю её, на логин перенаправляюсь автоматически, логинюсь, и она открывается) base_link = f"https://iqtools-{iqname}.intrtl.com/validate?confirm=&page=1&proposal=false& limit=0" , но со страницей, направляющей меня сразу на список картинок класса, так не получается iter_link = f"https://iqtools-{iqname}.intrtl.com/validate?klass_id={classid}&lots_id&size _id&confirm=&page=1&proposal=false&limit =0&klass_search="
0
|
|
|
|
|
| 19.12.2020, 18:48 | |
|
Нужно смотреть не html код, а запросы на вкладке Network и долго их анализировать.
1
|
|
|
0 / 0 / 0
Регистрация: 08.06.2015
Сообщений: 38
|
|
| 19.12.2020, 19:13 [ТС] | |
|
ясно.. да, уже изучала там пост запросы..
при запуске хрома из кода я теперь обратила внимание, что есть источники, чего нет в хроме просто у меня открываемом.. в принципе - это то, что мне и нужно, что я раньше находила на сайтах, а сейчас перестала
0
|
|
|
0 / 0 / 0
Регистрация: 08.06.2015
Сообщений: 38
|
||||||
| 22.12.2020, 11:23 [ТС] | ||||||
|
не получается продолжить с post запросом((( на этом моменте новая страница не загржуается (iter_url), я остаюсь на старой (base_url)
с чем это может быть связано?(( вроде я даже нашла как запустить ajax script, чтобы он проработал.. при этом в post запросах, там три запроса - неужели такое может быть, что надо три раза запрос посылать? там примерно одинаковые атрибуты..
0
|
||||||
|
0 / 0 / 0
Регистрация: 08.06.2015
Сообщений: 38
|
||||||
| 23.12.2020, 12:31 [ТС] | ||||||
|
ура, вышло вот так, можно оказывается просто get с нужным адресом прописать, хотя до этого так не срабатывало)
плюс использовала seleniumrequests, чтобы post запрос отправить и ещё чей-то код по ожиданию загрузки Ajax скрипта
0
|
||||||
| 23.12.2020, 12:31 | |
|
Помогаю со студенческими работами здесь
19
Python+selenium как продолжить цикл если не находится элемент Парсинг с использованием requests Парсинг JSON с использованием requests Парсинг динамического сайта библиотекой requests Парсинг olx.ua Python+requests+bs4 Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
||||
|
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта
Симптом:
После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
|
Access
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
|
Новый ноутбук
volvo 07.12.2025
Всем привет.
По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне:
Ryzen 5 7533HS
64 Gb DDR5
1Tb NVMe
16" Full HD Display
Win11 Pro
|
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
|
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
|
|
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов
На странице:
https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/
нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
|
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов.
. . .
|
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
|
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
|
Создание Single Page Application на фреймах
krapotkin 16.11.2025
Статья исключительно для начинающих. Подходы оригинальностью не блещут.
В век Веб все очень привыкли к дизайну Single-Page-Application .
Быстренько разберем подход "на фреймах".
Мы делаем одну. . .
|