weastyeast

При выводе декодированных байтов выводится ошибка

03.01.2014, 11:53. Показов 1116. Ответов 1
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Всем привет! При написании парсера столкнулся с такой проблемой
Python
1
2
3
4
5
6
from urllib.request import urlopen
 
url = 'http://ya.ru/'
data = urlopen(url).read()
 
print(data.decode('utf-8', errors='ignore'))
Появляется ошибка:
UnicodeEncodeError: 'charmap' codec can't encode character '\xa9' in position 6711: character maps to <undefined>

Хотя передается параметр errors='ignore'

Если попробовать декодировать так:
Python
1
print(b'\xa9SPAM'.decode('utf-8', errors='ignore'))
То никаких ошибок не возникает, и символ '\xa9' вырезается.

В чем может быть причина, что не срабатывает errors='ignore' в первом случае?
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
03.01.2014, 11:53
Ответы с готовыми решениями:

При выводе переменной aa, цена выводится очень странно если количество символов >3 то выводится что-то непонятное
import requests # импортируем библиотеку requests для выполнения http-запросов from bs4 import BeautifulSoup # импортируем библиотеку...

Ошибка в сортировке при выводе на экран, выводится только первое наименьшее значение
Создал программу, сортирующую массив,но есть ошибка в сортировке при выводе на экран, выводит только первое наименьшее значение. ...

Потеря байтов при выводе в Memo (потоки)
Присылаются пачти байтов . У меня программа выводит 9 байт информации с RS 485 в Memo. Мне из них нужен седьмой, потому что это...

1
2742 / 2341 / 620
Регистрация: 19.03.2012
Сообщений: 8,830
04.01.2014, 04:52
weastyeast, У меня ошибка не появляется.

Добавлено через 6 минут
Вообще советую пользоваться библиотекой requests. С ней работать на много проще и она сразу тебе отдаст в правильной кодировке страницу.

Python
1
2
3
4
import requests
 
data = requests.get('http://ya.ru/')
print(data.text)
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
04.01.2014, 04:52
Помогаю со студенческими работами здесь

При выводе числа выводится #INF
В общем, задали написать программу вычисления кубического уравнения. В сети нашёл алгоритм решения (ссыль, который можно спокойно...

При выводе числа выводится #INF - C++
Вообщем ,задали написать программу для вычисления значений функции для нескольких значений аргумента. Все написала, ошибок не выдаёт при...

При выводе числа выводится #INF
может кто обьяснить где тут проблема? задача - есть два метода исчисления одна функцией другая суммой нужно посчитать по ним и вывести...

выводится none с новой строки при выводе атрибута
Привет, помогите пожалуйста решить проблему - выводится none с новой строки при выводе атрибутов class Users(): def...

Выводится некорректный текст при выводе из таблицы (вопросиками)
Вывожу текст из таблицы, но он выводится вопросами, вот так: ????, ??? ? ?????? ???????? ???????????? ? ????? ???? ? ???????? ?????????...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
2
Ответ Создать тему
Опции темы

Новые блоги и статьи
сукцессия микоризы: основная теория в виде двух уравнений.
anaschu 11.01.2026
https:/ / rutube. ru/ video/ 7a537f578d808e67a3c6fd818a44a5c4/
WordPad для Windows 11
Jel 10.01.2026
WordPad для Windows 11 — это приложение, которое восстанавливает классический текстовый редактор WordPad в операционной системе Windows 11. После того как Microsoft исключила WordPad из. . .
Classic Notepad for Windows 11
Jel 10.01.2026
Old Classic Notepad for Windows 11 Приложение для Windows 11, позволяющее пользователям вернуть классическую версию текстового редактора «Блокнот» из Windows 10. Программа предоставляет более. . .
Почему дизайн решает?
Neotwalker 09.01.2026
В современном мире, где конкуренция за внимание потребителя достигла пика, дизайн становится мощным инструментом для успеха бренда. Это не просто красивый внешний вид продукта или сайта — это. . .
Модель микоризы: классовый агентный подход 3
anaschu 06.01.2026
aa0a7f55b50dd51c5ec569d2d10c54f6/ O1rJuneU_ls https:/ / vkvideo. ru/ video-115721503_456239114
Owen Logic: О недопустимости использования связки «аналоговый ПИД» + RegKZR
ФедосеевПавел 06.01.2026
Owen Logic: О недопустимости использования связки «аналоговый ПИД» + RegKZR ВВЕДЕНИЕ Введу сокращения: аналоговый ПИД — ПИД регулятор с управляющим выходом в виде числа в диапазоне от 0% до. . .
Модель микоризы: классовый агентный подход 2
anaschu 06.01.2026
репозиторий https:/ / github. com/ shumilovas/ fungi ветка по-частям. коммит Create переделка под биомассу. txt вход sc, но sm считается внутри мицелия. кстати, обьем тоже должен там считаться. . . .
Расчёт токов в цепи постоянного тока
igorrr37 05.01.2026
/ * Дана цепь постоянного тока с сопротивлениями и источниками (напряжения, ЭДС и тока). Найти токи и напряжения во всех элементах. Программа составляет систему уравнений по 1 и 2 законам Кирхгофа и. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru