|
1 / 1 / 0
Регистрация: 16.08.2013
Сообщений: 18
|
||||||
Ошибка кодировки при парсере веб страницы, содержащей кирилицу27.08.2015, 01:58. Показов 1790. Ответов 6
Метки нет (Все метки)
Привет.
Пишу свой первый парсер. Проблема в том, что часть адреса страницы содержит кириллицу. Я пробовал кодировать и туда, и сюда. но получается ошибка UnicodeEncodeError: 'ascii' codec can't encode characters in position 25-31: ordinal not in range(128) Отображается в консоли нормально - http://hh.ru/search/vacancy?te... ue&salary= Пробовал так же через urllib.parse.urlencode(), но что-то не выходит
0
|
||||||
| 27.08.2015, 01:58 | |
|
Ответы с готовыми решениями:
6
Почему при создании веб-страницы в FrontPage автоматически создается папка с изображениями, а при создании веб-страницы в DreamWeaver - нет? Из строки, содержащей полный адрес веб-страницы, выделить доменное имя сайта Ошибка при парсере (The specified path, file name, or both are too long.) |
|
0 / 0 / 0
Регистрация: 27.08.2015
Сообщений: 5
|
||||||
| 27.08.2015, 03:28 | ||||||
|
Как вариант проблема в переменной query:
Использовать именно BeautifulSoup критично? Также возможно баг именно в нем.
0
|
||||||
|
641 / 481 / 179
Регистрация: 28.05.2012
Сообщений: 1,419
|
|
| 27.08.2015, 04:42 | |
Сообщение было отмечено pashamt8 как решение
Решение
use requests в место urllib
1
|
|
|
2742 / 2341 / 620
Регистрация: 19.03.2012
Сообщений: 8,830
|
|
| 27.08.2015, 10:44 | |
|
pashamt8, выложи полный traceback ошибки.
0
|
|
|
1 / 1 / 0
Регистрация: 16.08.2013
Сообщений: 18
|
|
| 27.08.2015, 14:10 [ТС] | |
|
*
Проблему решил. Вместо urllib использую requests. Спасибо всем!
0
|
|
|
2742 / 2341 / 620
Регистрация: 19.03.2012
Сообщений: 8,830
|
|||||||
| 27.08.2015, 15:44 | |||||||
Сообщение было отмечено pashamt8 как решение
РешениеСуть твоей проблемы, что url не может содержать не ascii символы, по этому твой запрос нужно было закодировать специальной кодировкой и тогда ошибки ушли бы)
2
|
|||||||
|
1 / 1 / 0
Регистрация: 16.08.2013
Сообщений: 18
|
|
| 27.08.2015, 16:29 [ТС] | |
|
Да, ты прав.
Буду знать
0
|
|
| 27.08.2015, 16:29 | |
|
Помогаю со студенческими работами здесь
7
Ошибка сертификата при открытии в браузере веб-страницы по протоколу HTTPS Программа загружает и обрабатывает веб-страницы с веб-сервера статистики, при этом жутко тормозит Не открываются страницы, содержащие кирилицу
ошибка в парсере Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
Как я обхитрил таблицу Word
Alexander-7 21.03.2026
Когда мигает курсор у внешнего края таблицы, и нам надо перейти на новую строку, а при нажатии Enter создается новый ряд таблицы с ячейками, то мы вместо нервных нажатий Энтеров мы пишем любые буквы. . .
|
Krabik - рыболовный бот для WoW 3.3.5a
AmbA 21.03.2026
без регистрации и смс.
Это не торговля, приложение не содержит рекламы. Выполняет свою непосредственную задачу - автоматизацию рыбалки в WoW - и ничего более. Однако если админы будут против -. . .
|
Программный отбор значений справочника
Maks 21.03.2026
Установка программного отбора значений справочника "Сотрудники" из модуля формы документа.
В качестве фильтра для отбора служит предопределенное значение перечислений.
Процедура. . .
|
Переходник USB-CAN-GPIO
Eddy_Em 20.03.2026
Достаточно давно на работе возникла необходимость в переходнике CAN-USB с гальваноразвязкой, оный и был разработан. Однако, все меня терзала совесть, что аж 48-ногий МК используется так тупо: просто. . .
|
|
Оттенки серого
Argus19 18.03.2026
Оттенки серого
Нашёл в интернете 3 прекрасных модуля:
Модуль класса открытия диалога открытия/ сохранения файла на Win32 API;
Модуль класса быстрого перекодирования цветного изображения в оттенки. . .
|
SDL3 для Desktop (MinGW): Рисуем цветные прямоугольники с помощью рисовальщика SDL3 на Си и C++
8Observer8 17.03.2026
Содержание блога
Финальные проекты на Си и на C++:
finish-rectangles-sdl3-c. zip
finish-rectangles-sdl3-cpp. zip
|
Символические и жёсткие ссылки в Linux.
algri14 15.03.2026
Существует два типа ссылок — символические и жёсткие.
Ссылка в Linux — это запись в каталоге, которая может указывать либо на inode «файла-ИСТОЧНИКА», тогда это будет «жёсткая ссылка» (hard link),. . .
|
[Owen Logic] Поддержание уровня воды в резервуаре количеством включённых насосов: моделирование и выбор регулятора
ФедосеевПавел 14.03.2026
Поддержание уровня воды в резервуаре количеством включённых насосов: моделирование и выбор регулятора
ВВЕДЕНИЕ
Выполняя задание на управление насосной группой заполнения резервуара,. . .
|