|
0 / 0 / 2
Регистрация: 22.04.2015
Сообщений: 70
|
||||||||||||||||||||||||||
Selenium Скачивание файлов с сайта11.07.2018, 18:54. Показов 18263. Ответов 17
Метки нет (Все метки)
Добрый день.
Есть сайт с которого нужно скачать файлы. Делаю это так: Импорт библиотек:
пока все работает)
WebDriverException: Message: Failed to decode response from marionette
0
|
||||||||||||||||||||||||||
| 11.07.2018, 18:54 | |
|
Ответы с готовыми решениями:
17
Скачивание файлов с сайта Скачивание файлов с сайта Разрешения на скачивание файлов с сайта |
|
0 / 0 / 2
Регистрация: 22.04.2015
Сообщений: 70
|
|||||||||||
| 12.07.2018, 19:19 [ТС] | |||||||||||
|
Welemir1, Здравствуйте, спасибо, что не прошли мимо моего сообщения.
Массив files хранит ссылки на нужные файлы. на сайте файлы хранятся как ссылки:
Кликать на что либо для скачивания нет необходимости(я такую ссылку могу вставить в адресную строку браузера и после появится окно "Сохранить как")... Мне удается скачать первый файл из массива, но дальше дело не идет, после
Посоветуете что-то ?
0
|
|||||||||||
|
Автоматизируй это!
|
||
| 12.07.2018, 19:35 | ||
|
2) попробуйте именно прокликать ссылки и проверить, скачает ли при таком сценарии но ответа на вопрос так и нет - что конкретно то проверяем? в чем хотим убедиться?
0
|
||
|
0 / 0 / 2
Регистрация: 22.04.2015
Сообщений: 70
|
||||||
| 15.07.2018, 20:30 [ТС] | ||||||
|
Вообщем, искал в инете ничего что помогло бы не нашел...
нужно скачать файл CSV который хранится по прямой ссылке Вот мой код:
browser.get('https://digital-agenda-data.eu/download/digital-agenda-scoreboard-key-indicators.csv.zip') просто "висит" (не знаю как еще это описать, проще протестировать) и в итоге выдает ошибку: Message: Timeout loading page after 300000ms и только после переходит к дальнейшему коду. Подскажите что не так или по возможности доработайте код п.с. скачивание должно происходить с помощью selenium т.к. до этого используется для авторизации
0
|
||||||
|
Автоматизируй это!
|
|
| 16.07.2018, 06:32 | |
|
1) все же зря не попробовал авторизоваться и кликнуть по ссылке, он тебе и ошибку пишет, что не может страницу загрузить, потому что это не страница
2) можно авторизоваться и без селениум, обойтись 2 запросами -1 запрос авторизации (получаем куки) 2 запрос к файлу с этой куки. Рекомендую библиотеку requests
0
|
|
|
0 / 0 / 2
Регистрация: 22.04.2015
Сообщений: 70
|
|
| 16.07.2018, 19:11 [ТС] | |
|
все же зря не попробовал авторизоваться и кликнуть по ссылке - пробовал, результата не получил.
можно авторизоваться и без селениум - можно рекомендацию получить в виде конкретного примера? сколько я не пытаюсь найти толковый пример все в них "общее об общем", короче ценнопознавательно ничего нет, иначе не писал бы на форум
0
|
|
|
Автоматизируй это!
|
|||||||
| 16.07.2018, 19:35 | |||||||
|
не понял, а зачем авторизация, зашел на сайт, там вот ссылка https://digital-agenda-data.eu... rs.csv.zip вот тебе общее об общем:
0
|
|||||||
|
|
|
| 16.07.2018, 19:48 | |
|
А как зарегаться на это сайте? Форму логина нашел - регистрации нет.
Если авторизация нужна (хотя, как показал Welemir1, файлы и так загружаются), то опять же, как и посоветовали выше, очень даже вероятно (99.9%), что можно обойтись простым requests без всяких селениумов.
0
|
|
|
0 / 0 / 2
Регистрация: 22.04.2015
Сообщений: 70
|
|||||||||||
| 16.07.2018, 21:22 [ТС] | |||||||||||
|
Прежде всего хочу поблагодарить за ответы.
... себе все пальцы изгуглил уже в поисках примеров и описаний самое типа точно что нашел это вот: http://docs.python-requests.org/en/master/ ожидал, что здесь-то получу полное описание всего, проштудирую мануалы и все вопросы отпадут, но увы Авторизация необходима, без ее успешного прохождения не будет доступа к ссылкам на нужные файлы! вышеописанная ссылка https://digital-agenda-data.eu... rs.csv.zip это как пример того в каком виде инфа лежит на сайте после прохождения успешной авторизации авторизация на сайте происходит через форму, которая имеет поля: Логин(id='Login') Пароль(id='Password') Запомнить меня(id='Remember') Кнопка вход когда я реализовывал авторизацию через selenium проблем нет: через xpath нашел нужные элементы, передал нужные значения, кликнул по кнопке вход и вуаля! я залогинился. Нужно было только скачать файл, но как описано выше скачать не удавалось. Согласно рекомендация полез через reaquests(я его и до этого пробовал) вот что написал:
У меня элементарный вопрос: как при таком способе авторизации без привязки логина и пароля к конкретным поля данные попросту не будут перепутаны??? в отличии того как это выглядит при использовании selenium
0
|
|||||||||||
|
|
||||||||||||
| 16.07.2018, 22:26 | ||||||||||||
0
|
||||||||||||
|
0 / 0 / 2
Регистрация: 22.04.2015
Сообщений: 70
|
|
| 16.07.2018, 22:56 [ТС] | |
|
Garry Galler, спасибо за ответ, уже по этому примеру становится более понятен принцип решения моей задачи.
посоветуйте, где можно почитать описание методов и функций?
0
|
|
|
0 / 0 / 2
Регистрация: 22.04.2015
Сообщений: 70
|
|
| 16.07.2018, 23:15 [ТС] | |
|
Тест файл:
0
|
|
|
Автоматизируй это!
|
||
| 17.07.2018, 05:40 | ||
|
0
|
||
|
0 / 0 / 2
Регистрация: 22.04.2015
Сообщений: 70
|
||||||||||||||||||||||||||
| 18.07.2018, 21:05 [ТС] | ||||||||||||||||||||||||||
|
После полученных рекомендаций от Garry Galler, принялся за написание.
Вот что получилась:
Invalid URL 'login.php?do=login': No schema supplied. Perhaps you meant http://login.php?do=login? Понимаю, что ошибка здесь: http://login.php?do=login? и вероятно нужно как-то исправить сам
попробовал action задать так:
Добавлено через 11 минут сделал такой вариант:
получил: <RequestsCookieJar[<Cookie bblastactivity=0 for www.cyberforum.ru/>, <Cookie bborig_cookieuser=1 for www.cyberforum.ru/>]> правильно ли я понимаю что авторизация успешна?
0
|
||||||||||||||||||||||||||
|
|
||||||
| 18.07.2018, 22:29 | ||||||
|
Слишком много действий наугад - документацию читайте.
action может быть как относительным, так и абсолютным - это тоже нужно учитывать.
В примере они закомментированы.
0
|
||||||
|
0 / 0 / 2
Регистрация: 22.04.2015
Сообщений: 70
|
|
| 22.07.2018, 12:01 [ТС] | |
|
Garry Galler, спасибо за ответ.
пока вопрос на паузе(задач навалилось)
0
|
|
| 22.07.2018, 12:01 | |
|
Помогаю со студенческими работами здесь
18
Скачивание с сайта пдф файлов Поочередное скачивание файлов с сайта на ПК Реализация ограничения на скачивание файлов с сайта Скачивание файлов с сайта только после регистрации selenium, скачивание файла Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
Реалии
Hrethgir 01.03.2026
Нет, я не закончил до сих пор симулятор. Эта задача сложнее. Не получилось уйти в плавсостав, но оно и к лучшему, возможно. Точнее получалось - но сварщиком в палубную команду, а это значит, в моём. . .
|
Ритм жизни
kumehtar 27.02.2026
Иногда приходится жить в ритме, где дел становится всё больше, а вовлечения в происходящее — всё меньше. Плотный график не даёт вниманию закрепиться ни на одном событии. Утро начинается с быстрых,. . .
|
SDL3 для Web (WebAssembly): Сборка SDL3 и Box2D из исходников с помощью CMake и Emscripten
8Observer8 27.02.2026
Недавно вышла версия 3. 4. 2 библиотеки SDL3. На странице официальной релиза доступны исходники, готовые DLL (для x86, x64, arm64), а также библиотеки для разработки под Android, MinGW и Visual Studio. . . .
|
SDL3 для Web (WebAssembly): Реализация движения на Box2D v3 - трение и коллизии с повёрнутыми стенами
8Observer8 20.02.2026
Содержание блога
Box2D позволяет легко создать главного героя, который не проходит сквозь стены и перемещается с заданным трением о препятствия, которые можно располагать под углом, как верхнее. . .
|
|
Конвертировать закладки radiotray-ng в m3u-плейлист
damix 19.02.2026
Это можно сделать скриптом для PowerShell. Использование
. \СonvertRadiotrayToM3U. ps1 <path_to_bookmarks. json>
Рядом с файлом bookmarks. json появится файл bookmarks. m3u с результатом.
# Check if. . .
|
Семь CDC на одном интерфейсе: 5 U[S]ARTов, 1 CAN и 1 SSI
Eddy_Em 18.02.2026
Постепенно допиливаю свою "многоинтерфейсную плату". Выглядит вот так:
https:/ / www. cyberforum. ru/ blog_attachment. php?attachmentid=11617&stc=1&d=1771445347
Основана на STM32F303RBT6.
На борту пять. . .
|
Камера Toupcam IUA500KMA
Eddy_Em 12.02.2026
Т. к. у всяких "хикроботов" слишком уж мелкий пиксель, для подсмотра в ESPriF они вообще плохо годятся: уже 14 величину можно рассмотреть еле-еле лишь на экспозициях под 3 секунды (а то и больше),. . .
|
И ясному Солнцу
zbw 12.02.2026
И ясному Солнцу,
и светлой Луне.
В мире
покоя нет
и люди
не могут жить в тишине.
А жить им немного лет.
|