С Новым годом! Форум программистов, компьютерный форум, киберфорум
Python для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.52/21: Рейтинг темы: голосов - 21, средняя оценка - 4.52
 Аватар для sasha300
6 / 3 / 0
Регистрация: 12.07.2014
Сообщений: 183

Почему в Python3 под Wndows нужно явно указывать кодировку?

11.08.2019, 19:02. Показов 4403. Ответов 4

Студворк — интернет-сервис помощи студентам
Добрый день!
Как сделать, чтобы Python в Windows воспринимал по дефолту входящие файлы в UTF-8 ?

Есть текстовый файл в формате UTF-8, к нему идет обращение:
Python
1
2
3
4
filename = "text.txt"
with open(filename) as file_object:
    content = file_object.read()
    print(content)
В Linux код срабатывает, но если перенести скрипт и текстовый файл на винду, то вылазит ошибка:
Traceback (most recent call last):
File "10_1.py", line 6, in <module>
content = file_object.read()
File "C:\Users\sas\AppData\Local\Programs\Pyt hon\Python37-32\lib\encodings\cp1
251.py", line 23, in decode
return codecs.charmap_decode(input,self.errors, decoding_table)[0]
UnicodeDecodeError: 'charmap' codec can't decode byte 0x98 in position 152: char
acter maps to <undefined>


------------------
(program exited with code: 1)

Для продолжения нажмите любую клавишу . . .
Приходится принудительно выставлять кодировку, чтобы код заработал:
Python
1
2
3
4
filename = "text.txt"
with open(filename, encoding = "utf-8" as file_object:
    content = file_object.read()
    print(content)
Как utf-8 сделать дефолтной кодировкой для Python, дабы принудительно не выставлять ее в скипте?
p.s.: сейчас по выводу ошибки видно, что Python ждет файлы в кодировке cp-1251
0
Лучшие ответы (1)
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
11.08.2019, 19:02
Ответы с готовыми решениями:

Зачем нужно явно указывать тип переменной?
Всем привет! Объясните зачем нужно явно указывать тип переменной? Например в С++ это обязательно, а php нет. Просто говорят что не...

При вынесении определения всегда ли нужно указывать функцию как inline явно?
Бьярни пишет class char_stack { int size; char* top; char* s; public: char_stack(int sz) { top=s=new char; } ...

Почему под данные структуры иногда явно выделяют память?
Видел коды, где под саму структуру и её данные явно выделяется память при помощи malloc которую так же вручную приходится освобождать. ...

4
1732 / 970 / 199
Регистрация: 22.02.2018
Сообщений: 2,693
Записей в блоге: 6
11.08.2019, 19:58
sasha300, В питоне 3.Х кодировкой по умолчанию является utf-8. Если Ваши файлы имеют эту кодировку, то ничего указывать не надо. Если же Ваши файлы имеют другую кодировку, то их нужно декодировать, и питон переведет их в кодировку utf-8, с которой он работает по умолчанию.
1
131 / 146 / 19
Регистрация: 19.02.2017
Сообщений: 619
11.08.2019, 20:02
sasha300, потому что редакторы в Windows обычно кодируют по умолчанию в другой кодировке.
1
1732 / 970 / 199
Регистрация: 22.02.2018
Сообщений: 2,693
Записей в блоге: 6
11.08.2019, 20:03
Ваш первый пример показывает, что Ваш файл имеет кодировку отличную от utf-8
0
Эксперт Python
5438 / 3859 / 1215
Регистрация: 28.10.2013
Сообщений: 9,552
Записей в блоге: 1
11.08.2019, 20:59
Лучший ответ Сообщение было отмечено sasha300 как решение

Решение

Цитата Сообщение от sasha300 Посмотреть сообщение
В Linux код срабатывает, но если перенести скрипт и текстовый файл на винду, то вылазит ошибка
Потому что экстрасенсов нет и нужно всегда указывать кодировку файла. Даже на линукс, так как файл созданный не на линукс, но перенесенный туда - сам кодировку волшебным образом не поменяет. На линукс кодировка текстовых файлов по умолчанию utf-8, на windows - та, которая соответствует пользовательской локали, которая в свою очередь зависит от установленного языка интерфейса.

Цитата Сообщение от sasha300 Посмотреть сообщение
Python ждет файлы в кодировке cp-1251
Да, потому что у тебя русская windows и кодировка по умолчанию - windows-1251. И это (умолчания) нельзя изменить.
Python не имеет привычки угадывать - он берет умолчания из системы, если пользователь не позаботился указать настройки явно.

Добавлено через 3 минуты
Цитата Сообщение от sasha300 Посмотреть сообщение
Как utf-8 сделать дефолтной кодировкой для Python
Она и так является дефолтной. Но ты, видимо, не понимаешь что это относится только к файлам скриптов.
1
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
11.08.2019, 20:59
Помогаю со студенческими работами здесь

Как избавиться от необходимости явно указывать тип в enum?
Как сделать, чтобы для перечислений не нужно было явно указывать тип int? switch (direction) { case...

Почему в функции с переменной не нужно указывать имя модуля?
import zipfile i = True if zipfile.is_zipfile('123.zip') == i: print(&quot;Всё прошло успешно&quot;) z = zipfile.ZipFile('123.zip',...

Почему в scanf нужно указывать именно адреса переменных?
Почему в функции scanf нужно указывать именно адреса переменных? Почему не работает, когда указываем переменную? Что хранит в себе...

Почему нужно указывать адрес отправителя почты, если он уже указан в JavaMailSender
конфигурационный файл @Configuration @PropertySource(value = {&quot;classpath:mail/mail.properties&quot;}) @ComponentScans({ ...

Каковы три случая, когда надо явно указывать приведение примитивных типов в Java?
Моя наставница по Java после проверки того, насколько хорошо я усвоил материал, сказала, что у меня проблемы с пониманием приведением...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
5
Ответ Создать тему
Новые блоги и статьи
WordPad для Windows 11
Jel 10.01.2026
WordPad для Windows 11 — это приложение, которое восстанавливает классический текстовый редактор WordPad в операционной системе Windows 11. После того как Microsoft исключила WordPad из. . .
Classic Notepad for Windows 11
Jel 10.01.2026
Old Classic Notepad for Windows 11 Приложение для Windows 11, позволяющее пользователям вернуть классическую версию текстового редактора «Блокнот» из Windows 10. Программа предоставляет более. . .
Почему дизайн решает?
Neotwalker 09.01.2026
В современном мире, где конкуренция за внимание потребителя достигла пика, дизайн становится мощным инструментом для успеха бренда. Это не просто красивый внешний вид продукта или сайта — это. . .
Модель микоризы: классовый агентный подход 3
anaschu 06.01.2026
aa0a7f55b50dd51c5ec569d2d10c54f6/ O1rJuneU_ls https:/ / vkvideo. ru/ video-115721503_456239114
Owen Logic: О недопустимости использования связки «аналоговый ПИД» + RegKZR
ФедосеевПавел 06.01.2026
Owen Logic: О недопустимости использования связки «аналоговый ПИД» + RegKZR ВВЕДЕНИЕ Введу сокращения: аналоговый ПИД — ПИД регулятор с управляющим выходом в виде числа в диапазоне от 0% до. . .
Модель микоризы: классовый агентный подход 2
anaschu 06.01.2026
репозиторий https:/ / github. com/ shumilovas/ fungi ветка по-частям. коммит Create переделка под биомассу. txt вход sc, но sm считается внутри мицелия. кстати, обьем тоже должен там считаться. . . .
Расчёт токов в цепи постоянного тока
igorrr37 05.01.2026
/ * Дана цепь постоянного тока с сопротивлениями и напряжениями. Надо найти токи в ветвях. Программа составляет систему уравнений по 1 и 2 законам Кирхгофа и решает её. Последовательность действий:. . .
Новый CodeBlocs. Версия 25.03
palva 04.01.2026
Оказывается, недавно вышла новая версия CodeBlocks за номером 25. 03. Когда-то давно я возился с только что вышедшей тогда версией 20. 03. С тех пор я давно снёс всё с компьютера и забыл. Теперь. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru