Форум программистов, компьютерный форум, киберфорум
Python
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 5.00/11: Рейтинг темы: голосов - 11, средняя оценка - 5.00
1 / 1 / 1
Регистрация: 19.07.2016
Сообщений: 118

Ошибка в парсинге

17.01.2017, 09:21. Показов 2326. Ответов 3

Студворк — интернет-сервис помощи студентам
Скачал urllib и bs4 решил тест провести.
Код правильный,и запускается у других,только не у меня
Установил через pip,питон 3.4
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
import urllib.request
import urllib.parse
import re
 
url = 'http://dotabuff.com'
values = {'s':'basics','submit':'search'}
data = urllib.parse.urlencode(values)
data = data.encode('utf-8')
req = urllib.request.Request(url,data)
resp = urllib.request.urlopen(req)
respData = resp.read()
 
print(respData)
Выдаёт:

Traceback (most recent call last):
File "H:\Python34\lib\urllib\request.py", line 1182, in do_open
h.request(req.get_method(), req.selector, req.data, headers)
File "H:\Python34\lib\http\client.py", line 1088, in request
self._send_request(method, url, body, headers)
File "H:\Python34\lib\http\client.py", line 1126, in _send_request
self.endheaders(body)
File "H:\Python34\lib\http\client.py", line 1084, in endheaders
self._send_output(message_body)
File "H:\Python34\lib\http\client.py", line 922, in _send_output
self.send(msg)
File "H:\Python34\lib\http\client.py", line 857, in send
self.connect()
File "H:\Python34\lib\http\client.py", line 1231, in connect
server_hostname=server_hostname)
File "H:\Python34\lib\ssl.py", line 365, in wrap_socket
_context=self)
File "H:\Python34\lib\ssl.py", line 583, in __init__
self.do_handshake()
File "H:\Python34\lib\ssl.py", line 810, in do_handshake
self._sslobj.do_handshake()
ssl.SSLError: [SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed (_ssl.c:600)

During handling of the above exception, another exception occurred:

Traceback (most recent call last):
File "H:\Python34\TEST.py", line 10, in <module>
resp = urllib.request.urlopen(req)
File "H:\Python34\lib\urllib\request.py", line 161, in urlopen
return opener.open(url, data, timeout)
File "H:\Python34\lib\urllib\request.py", line 469, in open
response = meth(req, response)
File "H:\Python34\lib\urllib\request.py", line 579, in http_response
'http', request, response, code, msg, hdrs)
File "H:\Python34\lib\urllib\request.py", line 501, in error
result = self._call_chain(*args)
File "H:\Python34\lib\urllib\request.py", line 441, in _call_chain
result = func(*args)
File "H:\Python34\lib\urllib\request.py", line 684, in http_error_302
return self.parent.open(new, timeout=req.timeout)
File "H:\Python34\lib\urllib\request.py", line 463, in open
response = self._open(req, data)
File "H:\Python34\lib\urllib\request.py", line 481, in _open
'_open', req)
File "H:\Python34\lib\urllib\request.py", line 441, in _call_chain
result = func(*args)
File "H:\Python34\lib\urllib\request.py", line 1225, in https_open
context=self._context, check_hostname=self._check_hostname)
File "H:\Python34\lib\urllib\request.py", line 1184, in do_open
raise URLError(err)
urllib.error.URLError: <urlopen error [SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed (_ssl.c:600)>

Добавлено через 8 минут
Ошибка решается если изменить url на другой сайт,но почему я немогу взять код сайта которого я хочу? Для это же не нужен ответ или разрешения сервера раз я просто копирую сам html сайта,я могу и с руки так сделать
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
17.01.2017, 09:21
Ответы с готовыми решениями:

Ошибка при парсинге
Здравствуйте. Пытаюсь написать простой парсер, но возникла непонятная ошибка Например, страница...

Ошибка при парсинге
В общем по учебе надо пропарсить tutu.ru чтобы подобрать ближайшую электричку. При парсинге столкнулся с дилеммой, из-за которой горит не...

Ошибка при парсинге на bs4 =(
Не пойму почему при парсинге гугла он не чего не находит в перемменую desc Ниже код import requests from bs4 import BeautifulSoup...

3
 Аватар для Ennjin
103 / 81 / 54
Регистрация: 25.11.2016
Сообщений: 278
17.01.2017, 16:00
попробуйте библиотеку requests.
Цитата Сообщение от Сергей Мишин Посмотреть сообщение
взять код сайта
Пример
Python
1
2
r = requests.get('http://dotabuff.com')
print(r.text)
0
1 / 1 / 1
Регистрация: 19.07.2016
Сообщений: 118
17.01.2017, 17:16  [ТС]
Спасибо,а как считать определенное кол-во байт в requests?
0
 Аватар для Ennjin
103 / 81 / 54
Регистрация: 25.11.2016
Сообщений: 278
17.01.2017, 19:43
Цитата Сообщение от Сергей Мишин Посмотреть сообщение
Спасибо,а как считать определенное кол-во байт в requests?
http://docs.python-requests.or... se-content
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
17.01.2017, 19:43
Помогаю со студенческими работами здесь

Ошибка при парсинге валют
import requests from bs4 import BeautifulSoup from datetime import datetime url = &quot;http://www.cbr.ru/scripts/XML_daily.asp?&quot; ...

Странная ошибка при парсинге
Вчера этот же код работал, а сегодня уже выдает ошибку. Проверил еще на одном сайте, работает. import requests from bs4 import...

Ошибка при парсинге Json
Ошибка возникаєт в парсенге, понять что он от меня хочет не могу. Сначала я делал всё как впримере где била другая сылка. Пример: ...

Ошибка при парсинге таблицы с сайта
Здравствуйте! Пытаюсь парсить таблицу с сайта: https://coinmarketcap.com/ Для начала хотел получить имена криптовалют из таблицы с...

Ошибка при парсинге (no attribute 'find_all')
Доброго дня. по примеру делаю парсинг табличных данных. ранее, в примере table был с id. Теперь в коде страницы пустой table. ...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
4
Ответ Создать тему
Новые блоги и статьи
модель ЗдравоСохранения 8. Подготовка к разному выполнению заданий
anaschu 08.04.2026
https:/ / github. com/ shumilovas/ med2. git main ветка * содержимое блока дэлэй из старой модели теперь внутри зайца новой модели 8ATzM_2aurI
Блокировка документа от изменений, если он открыт у другого пользователя
Maks 08.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа, разработанного в конфигурации КА2. Задача: запретить редактирование документа, если он открыт у другого пользователя. / / . . .
Система безопасности+живучести для сервера-слоя интернета (сети). Двойная привязка.
Hrethgir 08.04.2026
Далее были размышления о системе безопасности. Сообщения с наклонным текстом - мои. А как нам будет можно проверить, что ссылка наша, а не подделана хулиганами, которая выбросит на другую ветку и. . .
Модель ЗдрввоСохранения 7: больше работников, больше ресурсов.
anaschu 08.04.2026
работников и заданий может быть сколько угодно, но настроено всё так, что используется пока что только 20% kYBz3eJf3jQ
Дальние перспективы сервера - слоя сети с космологическим дизайном интефейса карты и логики.
Hrethgir 07.04.2026
Дальнейшее ближайшее планирование вывело к размышлениям над дальними перспективами. И вот тут может быть даже будут нужны оценки специалистов, так как в дальних перспективах всё может очень сильно. . .
Горе от ума
kumehtar 07.04.2026
Эта мне ментальная установка, что вот прямо сейчас, мол, мне для полного счастья не хватает (нужное вписать), и когда я этого достигну - тогда и полный кайф. Одна из самых сильных ловушек на пути. . . .
Использование значений реквизитов справочника в документе, с определенными условиями и правами
Maks 07.04.2026
1. Контроль срока действия договора Алгоритм из решения ниже реализован на примере нетипового документа "ЗаявкаНаРаботу", разработанного в конфигурации КА2. Задача: уведомлять пользователя, если. . .
Доступность команды формы по условию
Maks 07.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "СписаниеМатериалов", разработанного в конфигурации КА2. Задача: сделать доступной кнопку (команда формы "ЗавершитьСписание") при. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru