|
0 / 0 / 0
Регистрация: 08.06.2015
Сообщений: 38
|
||||||||||||||||
Зайти в сессию с requests и продолжить парсинг уже с Selenium16.11.2020, 09:45. Показов 14177. Ответов 18
Добрый день, совсем запуталась с решением задачи:
необходимо скачать картинки с нескольких страниц в одном разделе сайта (validate). На просторах интернета я нашла решение для скачивания и сохранения картинок с другого раздела сайта (classes) - всё хорошо работает. Вхожу с requests, далее обрабатываю с soup, поиск по тэгу img.
Но это не сработало с другим разделом сайта, где идет динамическая загрузка страницы, у меня не получается сохранить данные по входу в сессию, при попытке перейти на этот раздел, в коде страницы я вижу только код по вводу логина (стартовая страница). Я пробовала зайти с selenium_requests, чтобы дальше обрабатывать с selenium, но это не вышло. Так же думала как-то открыть динамическую страницу в данной сессии, но решения для этого не нашла. Это то, что я пробовала:
0
|
||||||||||||||||
| 16.11.2020, 09:45 | |
|
Ответы с готовыми решениями:
18
Python Selenium/Requests
Как продолжить действия с той же вкладкой Selenium? |
|
Автоматизируй это!
|
||
| 16.11.2020, 09:56 | ||
|
так используй обычный селениум -заходи на логин страницу, вводи поля и так далее, без реквестов и соуп. Если уж поднимать весь браузер то тогда запросы и парсер не нужны, селениум сам все умеет.
Добавлено через 2 минуты после клика авторизации дождись перехода на страницу, чтобы убедиться что авторизовалось, только потом переходи на нужный линк
1
|
||
|
0 / 0 / 0
Регистрация: 08.06.2015
Сообщений: 38
|
||||||
| 16.11.2020, 09:57 [ТС] | ||||||
|
у меня тоже не вышло, я думала, Что это из-за того, что в форму ещё передается hidden "_csrf-markup"
я не смогла это никак в Selenium передать, а так он не заходил, насколько уже помню(
0
|
||||||
|
0 / 0 / 0
Регистрация: 08.06.2015
Сообщений: 38
|
|||||||||||
| 19.11.2020, 07:20 [ТС] | |||||||||||
|
пока не выходит - вышло единожды!.. и я обрадовалась увидев знакомые кучу img, но когда я решила обработать этот код и доставать картинки, всё сломалось, хотя я не меняла ничего..
что я понимаю из кода странички, что вход почему-то не осуществлен - это моя догадка( я пыталась так же нажать на элемент на странице с Селениум (в комментах видны куски кода) - не выходит тоже)
что я вижу в итоге:
0
|
|||||||||||
|
0 / 0 / 0
Регистрация: 08.06.2015
Сообщений: 38
|
||||||||||||||||
| 19.11.2020, 09:42 [ТС] | ||||||||||||||||
|
да, он логин вводит и пароль, а потом его опять выбрасывает на страницу логин, как будто и не было логина.. может после клика подождать попросить.. (ожидание добавила, всё равно, в форму всё введено, но не логинится (может всё-таки в этом markup дело( в форме - полезная нагрузка запроса?
0
|
||||||||||||||||
|
Автоматизируй это!
|
||||||
| 19.12.2020, 11:26 | ||||||
0
|
||||||
|
|
|||||||
| 19.12.2020, 15:45 | |||||||
|
lxml позволяет работать напрямую с формами.
0
|
|||||||
|
0 / 0 / 0
Регистрация: 08.06.2015
Сообщений: 38
|
||||||
| 19.12.2020, 16:02 [ТС] | ||||||
|
а lxml поможет с динамическими страницами?
@Welemir1 помог с авторизацией на сайте - я теперь поняла, почему меня выкидывало (после get(логин_страница) я вызывала get(ревизия_страница) и меня выкидывало вновь) Пока не могу это решить, я уже даже стала основной страницей делать не логин страницу, а нужный раздел сайта, и я туда захожу, НО далее надо выбрать значение из выпадающего списка, чтобы отсортировать картинки на сайте (на текущий момент открыть напрямую страницу с нужным class_id не удалось).. я думаю как вариант попробовать остаться в сессии селениум, пока не понимаю как)
0
|
||||||
|
|
||
| 19.12.2020, 16:09 | ||
|
А все прочее можно получать через AJAX запросы.
1
|
||
|
0 / 0 / 0
Регистрация: 08.06.2015
Сообщений: 38
|
|
| 19.12.2020, 16:18 [ТС] | |
|
Спасибо! Почитаю про них!
0
|
|
|
|
||
| 19.12.2020, 16:31 | ||
|
AJAX запросы нужно уметь видеть в браузерных тулзах для разработчика и генерировать точно такие же. Многие динамические странички это просто AJAX запросы к серверу, который присылает json-чик с данными. Хотя, конечно, если страничка вся построена чисто на браузерном javascript, то с этим уже без эмуляции браузера никак не справиться.
0
|
||
|
0 / 0 / 0
Регистрация: 08.06.2015
Сообщений: 38
|
|
| 19.12.2020, 17:29 [ТС] | |
|
думаю, что да, JS
прилагаю принскрины. дело в том, что у меня открывается нужная страница после логина (то есть я сразу открываю её, на логин перенаправляюсь автоматически, логинюсь, и она открывается) base_link = f"https://iqtools-{iqname}.intrtl.com/validate?confirm=&page=1&proposal=false& limit=0" , но со страницей, направляющей меня сразу на список картинок класса, так не получается iter_link = f"https://iqtools-{iqname}.intrtl.com/validate?klass_id={classid}&lots_id&size _id&confirm=&page=1&proposal=false&limit =0&klass_search="
0
|
|
|
|
|
| 19.12.2020, 18:48 | |
|
Нужно смотреть не html код, а запросы на вкладке Network и долго их анализировать.
1
|
|
|
0 / 0 / 0
Регистрация: 08.06.2015
Сообщений: 38
|
|
| 19.12.2020, 19:13 [ТС] | |
|
ясно.. да, уже изучала там пост запросы..
при запуске хрома из кода я теперь обратила внимание, что есть источники, чего нет в хроме просто у меня открываемом.. в принципе - это то, что мне и нужно, что я раньше находила на сайтах, а сейчас перестала
0
|
|
|
0 / 0 / 0
Регистрация: 08.06.2015
Сообщений: 38
|
||||||
| 22.12.2020, 11:23 [ТС] | ||||||
|
не получается продолжить с post запросом((( на этом моменте новая страница не загржуается (iter_url), я остаюсь на старой (base_url)
с чем это может быть связано?(( вроде я даже нашла как запустить ajax script, чтобы он проработал.. при этом в post запросах, там три запроса - неужели такое может быть, что надо три раза запрос посылать? там примерно одинаковые атрибуты..
0
|
||||||
|
0 / 0 / 0
Регистрация: 08.06.2015
Сообщений: 38
|
||||||
| 23.12.2020, 12:31 [ТС] | ||||||
|
ура, вышло вот так, можно оказывается просто get с нужным адресом прописать, хотя до этого так не срабатывало)
плюс использовала seleniumrequests, чтобы post запрос отправить и ещё чей-то код по ожиданию загрузки Ajax скрипта
0
|
||||||
| 23.12.2020, 12:31 | |
|
Помогаю со студенческими работами здесь
19
Python+selenium как продолжить цикл если не находится элемент Парсинг с использованием requests Парсинг JSON с использованием requests Парсинг динамического сайта библиотекой requests Парсинг olx.ua Python+requests+bs4 Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
| Опции темы | |
|
|
Новые блоги и статьи
|
|||
|
Валидация и контроль данных табличной части документа перед записью
Maks 22.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа, разработанного в КА2.
Задача: контроль и валидация данных табличной части документа перед записью с учетом регламента компании. . .
|
Отчёт о затраченных материалах за определенный период с макетом печатной формы
Maks 21.04.2026
Отчёт из решения ниже размещён в конфигурации КА2.
Задача: разработка отчёта по затраченным материалам за определённый период, с возможностью вывода печатной формы отчёта с шапкой и подвалом.
В. . .
|
Отчёт о спецтехнике находящейся в ремонте
Maks 20.04.2026
Отчёт из решения ниже размещен в конфигурации КА2.
Задача: отобразить спецтехнику, которая на данный момент находится в ремонте.
Есть нетиповой документ "Заявка на ремонт спецтехники" который. . .
|
Памятка для бота и "визитка" для читателей "Semantic Universe Layer (Слой семантической вселенной)"
Hrethgir 19.04.2026
Сгенерировано для краткого описания по случаю сборки и компиляции скелета серверного приложения. И пусть после этого скажут, что статьи сгенерированные AI - туфта и не интересно. И это не реклама -. . .
|
|
Запрет удаления строк ТЧ документа при определённом условии
Maks 19.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "Аккумуляторы", разработанного в конфигурации КА2. У данного документа есть ТЧ, в которой в зависимости от прав доступа. . .
|
Модель заражения группы наркоманов
alhaos 17.04.2026
Условия задачи сформулированы тут
Суть:
- Группа наркоманов из 10 человек.
- Только один инфицирован ВИЧ.
- Колются одной иглой.
- Колются раз в день.
- Колются последовательно через. . .
|
Мысли в слух. Про "навсегда".
kumehtar 16.04.2026
Подумалось тут, что наверное очень глупо использовать во всяких своих установках понятие "навсегда". Это очень сильное понятие, и я только начинаю понимать край его смысла, не смотря на то что давно. . .
|
My Business CRM
MaGz GoLd 16.04.2026
Всем привет, недавно возникла потребность создать CRM, для личных нужд. Собственно программа предоставляет из себя базу данных клиентов, в которой можно фиксировать звонки, стадии сделки, а также. . .
|