0 / 0 / 0
Регистрация: 22.09.2013
Сообщений: 24

Как прочитать файл в кодировке cp1251?

08.10.2013, 01:17. Показов 66210. Ответов 17

Студворк — интернет-сервис помощи студентам
Написал такой код:
Python
1
2
3
inputFile = codecs.open('input.txt', 'r', 'cp1251')
words = inputFile.readline()
print(words)
Выводит - мама мыла раму
Что я делаю не так? Питон 3 версии.
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
08.10.2013, 01:17
Ответы с готовыми решениями:

Прочитать файл в кодировке cp1251 и перевести в кодировки koi8r, iso88595, unicode, microsoft sp866
работа с кодовыми таблицами русского языка дан исходный текст , кодировка cp-1251 составить программу, которая прочитает этот файл и...

Как записать в файл информацию в кодировке cp1251 (windows1251)?
У меня есть информация в utf-8 и мне нужно записать эту информацию в файл в cp1251, но дружелюбно с кириллицей. Делал декодирование через...

Не сохраняется файл в кодировке CP1251
Добрый день. Есть текст в кодировке UTF8. Необходимо сохранить его в файл в кодировке CP1251. Использую вот такой код ...

17
2742 / 2341 / 620
Регистрация: 19.03.2012
Сообщений: 8,830
08.10.2013, 01:21
Попробуй так:
Python
1
2
3
inputFile = open('input.txt', 'r', 'cp1251')
words = inputFile.readline()
print(words)
0
0 / 0 / 0
Регистрация: 22.09.2013
Сообщений: 24
08.10.2013, 01:28  [ТС]
Цитата Сообщение от tsar925 Посмотреть сообщение
Попробуй так:
Python
1
2
3
inputFile = open('input.txt', 'r', 'cp1251')
words = inputFile.readline()
print(words)
Python
1
2
3
4
Traceback (most recent call last):
  File "E:/Users/DartLenin/PycharmProjects/test/test.py", line 6, in <module>
    inputFile = open('input.txt', 'r', 'cp1251')
TypeError: an integer is required
0
2742 / 2341 / 620
Регистрация: 19.03.2012
Сообщений: 8,830
08.10.2013, 01:32
Python
1
2
input = open('aaa.txt').read()
print(input)
0
0 / 0 / 0
Регистрация: 22.09.2013
Сообщений: 24
08.10.2013, 01:35  [ТС]
Цитата Сообщение от tsar925 Посмотреть сообщение
Python
1
2
input = open('aaa.txt').read()
print(input)
мама мыла раму
0
2742 / 2341 / 620
Регистрация: 19.03.2012
Сообщений: 8,830
08.10.2013, 01:36
У меня все нормально. Ты с консолью виндовой работаешь? Я просто пробовал в IDLE.

Если в консоли, то тебе нужно преобразовать в данные в кодировку cp688.
0
0 / 0 / 0
Регистрация: 22.09.2013
Сообщений: 24
08.10.2013, 01:40  [ТС]
С консолью Pycharm. Ну он наверное виндовую использует.

Добавлено через 3 минуты
Python
1
2
input = open('input.txt').read()
print(input.encode('cp688'))
Python
1
LookupError: unknown encoding: cp688
0
 Аватар для JohnHomo
8 / 8 / 0
Регистрация: 26.09.2013
Сообщений: 31
08.10.2013, 05:12
Цитата Сообщение от DarthLenin Посмотреть сообщение
С консолью Pycharm. Ну он наверное виндовую использует.

Добавлено через 3 минуты
Python
1
2
input = open('input.txt').read()
print(input.encode('cp688'))
Python
1
LookupError: unknown encoding: cp688
Кодировка виндовой консоли не cp688 , а cp866.
А вообще можно сделать так:
Python
1
2
3
inputFile = codecs.open('input.txt', 'r', encoding='cp1251')
words = inputFile.readline()
print(words)
или так:
Python
1
2
3
inputFile = codecs.open('input.txt', 'r',encoding='utf-8')
words = inputFile.readline()
print(words)
1
2742 / 2341 / 620
Регистрация: 19.03.2012
Сообщений: 8,830
08.10.2013, 07:50
Цитата Сообщение от JohnHomo Посмотреть сообщение
Кодировка виндовой консоли не cp688 , а cp866.
спасибо, что поправил
ошибся

Добавлено через 3 минуты
DarthLenin, попробуй ещё раз с учётом изменившейся информации
1
Эксперт Python
 Аватар для dondublon
4653 / 2073 / 366
Регистрация: 17.03.2012
Сообщений: 10,183
Записей в блоге: 6
08.10.2013, 13:31
Python
1
words.decode('cp1251')
должно сработать.
1
0 / 0 / 0
Регистрация: 22.09.2013
Сообщений: 24
08.10.2013, 15:33  [ТС]
Спасибо всем, кто пытался помочь)
Python
1
2
3
inputFile = codecs.open('input.txt', 'r',encoding='utf-8')
words = inputFile.readline()
print(words)
по непонятным причинам сработало
0
 Аватар для Wolkodav
842 / 480 / 58
Регистрация: 18.09.2012
Сообщений: 1,688
08.10.2013, 17:00
Нашёл вот такую штучку, может поможет)
Миниатюры
Как прочитать файл в кодировке cp1251?  
3
 Аватар для Wolkodav
842 / 480 / 58
Регистрация: 18.09.2012
Сообщений: 1,688
08.10.2013, 17:01
Тут проще понять какая ошибка с кодировкой, чем методом перебора)
0
4866 / 3288 / 468
Регистрация: 10.12.2008
Сообщений: 10,570
08.10.2013, 21:35
Цитата Сообщение от tsar925 Посмотреть сообщение
Python
1
inputFile = open('input.txt', 'r', 'cp1251')
кодировка - это именованный аргумент

Python
1
2
3
4
>>> print(open.__doc__)
open(file, mode='r', buffering=-1, encoding=None,
     errors=None, newline=None, closefd=True, opener=None) -> file object
...
Цитата Сообщение от DarthLenin Посмотреть сообщение
Python
1
2
3
4
Traceback (most recent call last):
  File "E:/Users/DartLenin/PycharmProjects/test/test.py", line 6, in <module>
    inputFile = open('input.txt', 'r', 'cp1251')
TypeError: an integer is required
всё правильно выдаёт, там ожидается тип буферизации


Python
1
2
3
with open('input.txt', 'r',  encoding='cp1251') as inputFile:
    words = inputFile.readline()
print(words)
0
0 / 0 / 0
Регистрация: 22.09.2013
Сообщений: 24
08.10.2013, 22:09  [ТС]
Цитата Сообщение от accept Посмотреть сообщение
Python
1
2
3
with open('input.txt', 'r',  encoding='cp1251') as inputFile:
    words = inputFile.readline()
print(words)
Python
1
2
with open('input.txt', 'r',  encoding='cp1251') as inputFile:
TypeError: 'encoding' is an invalid keyword argument for this function
0
4866 / 3288 / 468
Регистрация: 10.12.2008
Сообщений: 10,570
08.10.2013, 23:49
Цитата Сообщение от DarthLenin Посмотреть сообщение
Что я делаю не так? Питон 3 версии.
значит, не третьей версии он у тебя, а второй
0
0 / 0 / 0
Регистрация: 22.09.2013
Сообщений: 24
09.10.2013, 00:03  [ТС]
Цитата Сообщение от accept Посмотреть сообщение
значит, не третьей версии он у тебя, а второй
Ок, я случайно запустил под 2.7 интерпретатором
Python
1
2
3
4
5
6
Traceback (most recent call last):
  File "E:/Users/DartLenin/PycharmProjects/test/practice.py", line 4, in <module>
    words = inputFile.readline()
  File "E:\Python33\lib\encodings\cp1251.py", line 23, in decode
    return codecs.charmap_decode(input,self.errors,decoding_table)[0]
UnicodeDecodeError: 'charmap' codec can't decode byte 0x98 in position 885: character maps to <undefined>
Вот что выдает 3
0
4866 / 3288 / 468
Регистрация: 10.12.2008
Сообщений: 10,570
09.10.2013, 00:07
значит, файл в другой кодировке (в нём есть символы, которые допустимы в другой кодировке, но не допустимы в cp1251)
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
09.10.2013, 00:07
Помогаю со студенческими работами здесь

Как прочитать файл в DOS-кодировке ?
У меня есть файл в DOS-кодировке. Как мне считать оттуда строку, чтобы она нормально отображалась, а не в виде закорючек?

Как прочитать файл в кодировке win1251?
Как прочитать файл сразу в кодировке win1251, при переводе в utf8 и обратно, файл ломается:(

Как прочитать текстовый файл в кодировке Win1251 (VS2005)?
Проект: textbox и две кнопки для вывода текста в разных кодировках. Вывожу текст в textbox1 Unicod - всё нормально, выводит по-русски: ...

Как можно прочитать файл текстовый в кодировке UTF-8?
Как можно прочитать файл текстовый в кодировке UTF-8?(при чтении c помощью FileSystemObject вместо русских букв другие символы)

Как заставить MySQL хранить данные в кодировке cp1251?
Мне необходимо хранить данные в MySQL в кодировке 1251. Где это настраивается?


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
18
Ответ Создать тему
Опции темы

Новые блоги и статьи
Сумматор с применением элементов трёх состояний.
Hrethgir 26.03.2026
Тут. https:/ / fips. ru/ EGD/ ab3c85c8-836d-4866-871b-c2f0c5d77fbc Первый документ красиво выглядит, но без схемы. Это конечно не даёт никаких плюсов автору, но тем не менее. . . всё может быть. . .
Автозаполнение реквизитов при создании документа
Maks 26.03.2026
Код из решения ниже размещается в модуле объекта документа, в процедуре "ПриСозданииНаСервере". Алгоритм проверки заполнения реализован для исключения перезаписи значения реквизита, которое может. . .
Команды "Заполнить" и "Очистить" на форме документа
Maks 26.03.2026
1. Команда формы "ЗаполнитьЗапчасти". На примере нетипового документа разработанного в конфигурации КА2. В качестве источника данных указан регистр накопления, в который записываются данные о. . .
Кому нужен AOT?
DevAlt 26.03.2026
Решил сделать простой ланчер Написал заготовку: dotnet new console --aot -o UrlHandler var items = args. Split(":"); var tag = items; var id = items; var executable = args;. . .
Отправка уведомления на почту при изменении наименования справочника
Maks 24.03.2026
Программная отправка письма электронной почты на примере изменения наименования типового справочника "Склады" в конфигурации БП3. Перед реализацией необходимо выполнить настройку системной учетной. . .
модель ЗдравоСохранения 5. Меньше увольнений- больше дохода!
anaschu 24.03.2026
Теперь система здравосохранения уменьшает количество увольнений. 9TO2GP2bpX4 a42b81fb172ffc12ca589c7898261ccb/ https:/ / rutube. ru/ video/ a42b81fb172ffc12ca589c7898261ccb/ Слева синяя линия -. . .
Midnight Chicago Blues
kumehtar 24.03.2026
Такой Midnight Chicago Blues, знаешь?. . Когда вечерние улицы становятся ночными, а ты не можешь уснуть. Ты идёшь в любимый старый бар, и бармен наливает тебе виски. Ты смотришь на пролетающие. . .
SDL3 для Desktop (MinGW): Вывод текста со шрифтом TTF с помощью библиотеки SDL3_ttf на Си и C++
8Observer8 24.03.2026
Содержание блога Финальные проекты на Си и на C++: finish-text-sdl3-c. zip finish-text-sdl3-cpp. zip
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru