|
0 / 0 / 0
Регистрация: 14.11.2016
Сообщений: 45
|
||||||
Парсинг по сайту08.07.2020, 10:37. Показов 2368. Ответов 14
Метки нет (Все метки)
Написал приложение, которое загружает страницу с сайта, сохраняет фотографию, переходит на следующую и повторяет, но при переходе на следующую страницу появляется ошибка. Кто подскажет, что я не так делаю?
C:\Users\администратор\PycharmProjects\u ntitled\venv\Scripts\python.exe C:/Users/администратор/.PyCharm2019.2/config/scratches/XKCD-RU.py Это комикЭлем - [<img alt="Эффект БДЛПСУДКС" border="0" src="https://xkcd.ru/i/1531_v5.png"/>, <img alt="ОднаКнопка" border="0" height="16" src="/static/odnaknopka.gif" width="136"/>] https://xkcd.ru/i/1531_v5.png Загружается изображение - 1531_v5.png Traceback (most recent call last): File "C:/Users/администратор/.PyCharm2019.2/config/scratches/XKCD-RU.py", line 27, in <module> res.raise_for_status() File "C:\Users\администратор\PycharmProjects\ untitled\venv\lib\site-packages\requests\models.py", line 941, in raise_for_status raise HTTPError(http_error_msg, response=self) requests.exceptions.HTTPError: 404 Client Error: Not Found for url: https://xkcd.com/https://xkcd.ru/i/1531_v5.png Process finished with exit code 1
0
|
||||||
| 08.07.2020, 10:37 | |
|
Ответы с готовыми решениями:
14
Парсинг JSON ответа. Парсинг строки с массивами
|
|
0 / 0 / 0
Регистрация: 14.11.2016
Сообщений: 45
|
||||||
| 08.07.2020, 11:42 [ТС] | ||||||
|
Отредактировал код получилось:
C:\Users\администратор\PycharmProjects\u ntitled\venv\Scripts\python.exe C:/Users/администратор/.PyCharm2019.2/config/scratches/XKCD-RU.py Загружается изображение - 1531_v5.png Загружается изображение - 0b7742.png Traceback (most recent call last): File "C:/Users/администратор/.PyCharm2019.2/config/scratches/XKCD-RU.py", line 28, in <module> res = requests.get(comicUrl) File "C:\Users\администратор\PycharmProjects\ untitled\venv\lib\site-packages\requests\api.py", line 76, in get return request('get', url, params=params, **kwargs) File "C:\Users\администратор\PycharmProjects\ untitled\venv\lib\site-packages\requests\api.py", line 61, in request return session.request(method=method, url=url, **kwargs) File "C:\Users\администратор\PycharmProjects\ untitled\venv\lib\site-packages\requests\sessions.py", line 516, in request prep = self.prepare_request(req) File "C:\Users\администратор\PycharmProjects\ untitled\venv\lib\site-packages\requests\sessions.py", line 459, in prepare_request hooks=merge_hooks(request.hooks, self.hooks), File "C:\Users\администратор\PycharmProjects\ untitled\venv\lib\site-packages\requests\models.py", line 314, in prepare self.prepare_url(url, params) File "C:\Users\администратор\PycharmProjects\ untitled\venv\lib\site-packages\requests\models.py", line 388, in prepare_url raise MissingSchema(error) requests.exceptions.MissingSchema: Invalid URL '/s/0b7742.png': No schema supplied. Perhaps you meant http:///s/0b7742.png? Process finished with exit code 1
0
|
||||||
|
0 / 0 / 0
Регистрация: 14.11.2016
Сообщений: 45
|
|
| 08.07.2020, 12:42 [ТС] | |
|
Я начинаю изучать язык, очень много непонятного и соответственно ошибаюсь.
0
|
|
|
Автоматизируй это!
|
|
| 08.07.2020, 12:44 | |
Сообщение было отмечено Димтри как решение
Решение
Димтри, его начинают изучать не с парсинга, а привет мир, списки, атрибуты, слайсы и т.д.
А мой ответ полностью понятен, также как строка интерпретатора - не бывает в инете адреса /s/0b7742.png, должно быть что-то вроде https://xkcd.com/s/0b7742.png, ты забыл начало добавить. Неужели не смог перевести строку в ошибке?
0
|
|
|
0 / 0 / 0
Регистрация: 14.11.2016
Сообщений: 45
|
|
| 08.07.2020, 12:50 [ТС] | |
|
Это я понял, не мог понять от куда она берется. Первая страница загружается нормально, оказалось сам ошибся в коде.
0
|
|
|
|
|
| 08.07.2020, 12:52 | |
|
Димтри,
Тебе товарищи все верно описали. Но если тебя так сильно волнует сабж, который ты не по силам взвалил на свои пока хрупкие плечи, то вот: в html далеко не всегда url'ы идут полным адресом. Они могут быть как абсолютными: "https://xkcd.ru/i/1531_v5.png", так и относительными: "/i/1531_v5.png" И поэтому нормальный программист всегда проверяет - абсолютный url или нет (точно также как в файловой системе). И если нет - подставляет хост. А если пользоваться нормальными либами для парсинга (а не УГ типа bs4), то там это все вообще на автомате можно сделать.
0
|
|
|
291 / 131 / 58
Регистрация: 24.11.2019
Сообщений: 532
|
|||
| 08.07.2020, 13:00 | |||
|
Добавлено через 2 минуты
0
|
|||
|
|
|
| 08.07.2020, 13:02 | |
|
0
|
|
|
291 / 131 / 58
Регистрация: 24.11.2019
Сообщений: 532
|
|
| 08.07.2020, 13:04 | |
|
Garry Galler, а начинающие?
0
|
|
|
|
|||||||
| 08.07.2020, 13:08 | |||||||
|
В lxml парсинг производится двумя строками:
0
|
|||||||
|
291 / 131 / 58
Регистрация: 24.11.2019
Сообщений: 532
|
|
| 08.07.2020, 13:14 | |
|
Garry Galler, я не про синтаксис, а вообще про его существование. Гуглишь и в первую очередь попадается BS.
0
|
|
|
|
||
| 08.07.2020, 13:21 | ||
|
После этого в доки bs4 я больше не заходил.
0
|
||
| 08.07.2020, 13:21 | |
|
Помогаю со студенческими работами здесь
15
По сайту! Поиск по сайту Поиск по сайту Подключение к сайту Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
Автозаполнение реквизита при выборе элемента справочника
Maks 27.03.2026
Программный код из решения ниже на примере нетипового документа "ЗаявкаНаРемонтСпецтехники" разработанного в конфигурации КА2.
При выборе "Спецтехники" (Тип Справочник. Спецтехника), заполняется. . .
|
Сумматор с применением элементов трёх состояний.
Hrethgir 26.03.2026
Тут.
https:/ / fips. ru/ EGD/ ab3c85c8-836d-4866-871b-c2f0c5d77fbc
Первый документ красиво выглядит, но без схемы.
Это конечно не даёт никаких плюсов автору, но тем не менее. . . всё может быть. . .
|
Автозаполнение реквизитов при создании документа
Maks 26.03.2026
Программный код из решения ниже размещается в модуле объекта документа, в процедуре "ПриСозданииНаСервере".
Алгоритм проверки заполнения реализован для исключения перезаписи значения реквизита,. . .
|
Команды формы и диалоговое окно
Maks 26.03.2026
1. Команда формы "ЗаполнитьЗапчасти".
Программный код из решения ниже на примере нетипового документа "ЗаявкаНаРемонтСпецтехники" разработанного в конфигурации КА2.
В качестве источника данных. . .
|
|
Кому нужен AOT?
DevAlt 26.03.2026
Решил сделать простой ланчер
Написал заготовку:
dotnet new console --aot -o UrlHandler
var items = args. Split(":");
var tag = items;
var id = items;
var executable = args;. . .
|
Отправка уведомления на почту при создании или изменении элементов справочника
Maks 24.03.2026
Программная отправка письма электронной почты на примере типового справочника "Склады" в конфигурации БП3.
Перед реализацией необходимо выполнить настройку системной учетной записи электронной. . .
|
модель ЗдравоСохранения 5. Меньше увольнений- больше дохода!
anaschu 24.03.2026
Теперь система здравосохранения уменьшает количество увольнений.
9TO2GP2bpX4
a42b81fb172ffc12ca589c7898261ccb/
https:/ / rutube. ru/ video/ a42b81fb172ffc12ca589c7898261ccb/
Слева синяя линия -. . .
|
Midnight Chicago Blues
kumehtar 24.03.2026
Такой Midnight Chicago Blues, знаешь?. .
Когда вечерние улицы становятся ночными, а ты не можешь уснуть. Ты идёшь в любимый старый бар, и бармен наливает тебе виски. Ты смотришь на пролетающие. . .
|