|
0 / 0 / 2
Регистрация: 22.04.2015
Сообщений: 70
|
||||||||||||||||||||||||||
Selenium Скачивание файлов с сайта11.07.2018, 18:54. Показов 17981. Ответов 17
Метки нет (Все метки)
Добрый день.
Есть сайт с которого нужно скачать файлы. Делаю это так: Импорт библиотек:
пока все работает)
WebDriverException: Message: Failed to decode response from marionette
0
|
||||||||||||||||||||||||||
| 11.07.2018, 18:54 | |
|
Ответы с готовыми решениями:
17
Скачивание файлов с сайта Скачивание файлов с сайта Разрешения на скачивание файлов с сайта |
|
0 / 0 / 2
Регистрация: 22.04.2015
Сообщений: 70
|
|||||||||||
| 12.07.2018, 19:19 [ТС] | |||||||||||
|
Welemir1, Здравствуйте, спасибо, что не прошли мимо моего сообщения.
Массив files хранит ссылки на нужные файлы. на сайте файлы хранятся как ссылки:
Кликать на что либо для скачивания нет необходимости(я такую ссылку могу вставить в адресную строку браузера и после появится окно "Сохранить как")... Мне удается скачать первый файл из массива, но дальше дело не идет, после
Посоветуете что-то ?
0
|
|||||||||||
|
Автоматизируй это!
|
||
| 12.07.2018, 19:35 | ||
|
2) попробуйте именно прокликать ссылки и проверить, скачает ли при таком сценарии но ответа на вопрос так и нет - что конкретно то проверяем? в чем хотим убедиться?
0
|
||
|
0 / 0 / 2
Регистрация: 22.04.2015
Сообщений: 70
|
||||||
| 15.07.2018, 20:30 [ТС] | ||||||
|
Вообщем, искал в инете ничего что помогло бы не нашел...
нужно скачать файл CSV который хранится по прямой ссылке Вот мой код:
browser.get('https://digital-agenda-data.eu/download/digital-agenda-scoreboard-key-indicators.csv.zip') просто "висит" (не знаю как еще это описать, проще протестировать) и в итоге выдает ошибку: Message: Timeout loading page after 300000ms и только после переходит к дальнейшему коду. Подскажите что не так или по возможности доработайте код п.с. скачивание должно происходить с помощью selenium т.к. до этого используется для авторизации
0
|
||||||
|
Автоматизируй это!
|
|
| 16.07.2018, 06:32 | |
|
1) все же зря не попробовал авторизоваться и кликнуть по ссылке, он тебе и ошибку пишет, что не может страницу загрузить, потому что это не страница
2) можно авторизоваться и без селениум, обойтись 2 запросами -1 запрос авторизации (получаем куки) 2 запрос к файлу с этой куки. Рекомендую библиотеку requests
0
|
|
|
0 / 0 / 2
Регистрация: 22.04.2015
Сообщений: 70
|
|
| 16.07.2018, 19:11 [ТС] | |
|
все же зря не попробовал авторизоваться и кликнуть по ссылке - пробовал, результата не получил.
можно авторизоваться и без селениум - можно рекомендацию получить в виде конкретного примера? сколько я не пытаюсь найти толковый пример все в них "общее об общем", короче ценнопознавательно ничего нет, иначе не писал бы на форум
0
|
|
|
Автоматизируй это!
|
|||||||
| 16.07.2018, 19:35 | |||||||
|
не понял, а зачем авторизация, зашел на сайт, там вот ссылка https://digital-agenda-data.eu... rs.csv.zip вот тебе общее об общем:
0
|
|||||||
|
|
|
| 16.07.2018, 19:48 | |
|
А как зарегаться на это сайте? Форму логина нашел - регистрации нет.
Если авторизация нужна (хотя, как показал Welemir1, файлы и так загружаются), то опять же, как и посоветовали выше, очень даже вероятно (99.9%), что можно обойтись простым requests без всяких селениумов.
0
|
|
|
0 / 0 / 2
Регистрация: 22.04.2015
Сообщений: 70
|
|||||||||||
| 16.07.2018, 21:22 [ТС] | |||||||||||
|
Прежде всего хочу поблагодарить за ответы.
... себе все пальцы изгуглил уже в поисках примеров и описаний самое типа точно что нашел это вот: http://docs.python-requests.org/en/master/ ожидал, что здесь-то получу полное описание всего, проштудирую мануалы и все вопросы отпадут, но увы Авторизация необходима, без ее успешного прохождения не будет доступа к ссылкам на нужные файлы! вышеописанная ссылка https://digital-agenda-data.eu... rs.csv.zip это как пример того в каком виде инфа лежит на сайте после прохождения успешной авторизации авторизация на сайте происходит через форму, которая имеет поля: Логин(id='Login') Пароль(id='Password') Запомнить меня(id='Remember') Кнопка вход когда я реализовывал авторизацию через selenium проблем нет: через xpath нашел нужные элементы, передал нужные значения, кликнул по кнопке вход и вуаля! я залогинился. Нужно было только скачать файл, но как описано выше скачать не удавалось. Согласно рекомендация полез через reaquests(я его и до этого пробовал) вот что написал:
У меня элементарный вопрос: как при таком способе авторизации без привязки логина и пароля к конкретным поля данные попросту не будут перепутаны??? в отличии того как это выглядит при использовании selenium
0
|
|||||||||||
|
|
||||||||||||
| 16.07.2018, 22:26 | ||||||||||||
0
|
||||||||||||
|
0 / 0 / 2
Регистрация: 22.04.2015
Сообщений: 70
|
|
| 16.07.2018, 22:56 [ТС] | |
|
Garry Galler, спасибо за ответ, уже по этому примеру становится более понятен принцип решения моей задачи.
посоветуйте, где можно почитать описание методов и функций?
0
|
|
|
0 / 0 / 2
Регистрация: 22.04.2015
Сообщений: 70
|
|
| 16.07.2018, 23:15 [ТС] | |
|
Тест файл:
0
|
|
|
Автоматизируй это!
|
||
| 17.07.2018, 05:40 | ||
|
0
|
||
|
0 / 0 / 2
Регистрация: 22.04.2015
Сообщений: 70
|
||||||||||||||||||||||||||
| 18.07.2018, 21:05 [ТС] | ||||||||||||||||||||||||||
|
После полученных рекомендаций от Garry Galler, принялся за написание.
Вот что получилась:
Invalid URL 'login.php?do=login': No schema supplied. Perhaps you meant http://login.php?do=login? Понимаю, что ошибка здесь: http://login.php?do=login? и вероятно нужно как-то исправить сам
попробовал action задать так:
Добавлено через 11 минут сделал такой вариант:
получил: <RequestsCookieJar[<Cookie bblastactivity=0 for www.cyberforum.ru/>, <Cookie bborig_cookieuser=1 for www.cyberforum.ru/>]> правильно ли я понимаю что авторизация успешна?
0
|
||||||||||||||||||||||||||
|
|
||||||
| 18.07.2018, 22:29 | ||||||
|
Слишком много действий наугад - документацию читайте.
action может быть как относительным, так и абсолютным - это тоже нужно учитывать.
В примере они закомментированы.
0
|
||||||
|
0 / 0 / 2
Регистрация: 22.04.2015
Сообщений: 70
|
|
| 22.07.2018, 12:01 [ТС] | |
|
Garry Galler, спасибо за ответ.
пока вопрос на паузе(задач навалилось)
0
|
|
| 22.07.2018, 12:01 | |
|
Помогаю со студенческими работами здесь
18
Скачивание с сайта пдф файлов Поочередное скачивание файлов с сайта на ПК Реализация ограничения на скачивание файлов с сайта Скачивание файлов с сайта только после регистрации selenium, скачивание файла Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
||||
|
Кто-нибудь знает, где можно бесплатно получить настольный компьютер или ноутбук? США.
Programma_Boinc 26.12.2025
Кто-нибудь знает, где можно бесплатно получить настольный компьютер или ноутбук? США.
Нашел на реддите интересную статью под названием «Кто-нибудь знает, где получить бесплатный компьютер или. . .
|
Thinkpad X220 Tablet — это лучший бюджетный ноутбук для учёбы, точка.
Programma_Boinc 23.12.2025
Рецензия / Мнение/ Перевод
Нашел на реддите интересную статью под названием The Thinkpad X220 Tablet is the best budget school laptop period . Ниже её машинный перевод.
Thinkpad X220 Tablet —. . .
|
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта
Симптом:
После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
|
Как объединить две одинаковые БД Access с разными данными
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
|
Новый ноутбук
volvo 07.12.2025
Всем привет.
По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне:
Ryzen 5 7533HS
64 Gb DDR5
1Tb NVMe
16" Full HD Display
Win11 Pro
|
|
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
|
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
|
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов
На странице:
https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/
нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
|
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов.
. . .
|
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
|