Форум программистов, компьютерный форум, киберфорум
Python
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.66/64: Рейтинг темы: голосов - 64, средняя оценка - 4.66
0 / 0 / 0
Регистрация: 27.09.2015
Сообщений: 16

Считывание txt в кодировке utf-8

10.03.2017, 10:47. Показов 12174. Ответов 10
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Возникла проблема при считывании текстовых файлов в кодировке utf-8. Вернее, считывать-то считывает, однако почему-то дальше программа отрабатывает неправильно, хотя при консольном вводе/выводе всё прекрасно:

Python
1
2
3
4
5
6
7
8
9
10
# -*- coding: utf-8 -*-
import codecs
s = codecs.open('input.txt','r', encoding='utf-8').read().split()
m = s[0].upper()
l = s[1].upper()
print(m + ' ' + l)
if (m == l):
    print(1)
else:
    print(0)
Программа считывает 2 слова и сравнивает их, если они независимо от регистра одинаковы, то выводит 1, иначе 0. Сейчас же всегда выводит 0. Python 3
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
10.03.2017, 10:47
Ответы с готовыми решениями:

Ошибка при кодировке в UTF-8
Вот, написал код. Здесь его часть в начале файла указана кодировка UTF-8, перед строкой поставил "u", но всё равно когда в Visual...

Код не выводит символы в кодировке UTF-8, которые представляют из себя суррогатные пары юникода
Друзья! Продолжаем разбираться с юникодом .Вот код. Он должен выводить таблицу юникода, точнее первые 65535 символов. #!/usr/bin/env...

Как правильно вывести файл в кодировке UTF-16LE?
Друзья! НА самом-то деле я всё правильно делаю. Вот код: import codecs f = codecs.open ("foo.txt", 'r', "UTF-16LE") ...

10
 Аватар для Ennjin
103 / 81 / 54
Регистрация: 25.11.2016
Сообщений: 278
10.03.2017, 11:11
ilyasoloma,
Python
1
2
3
with open('input.txt') as fin:
    a, b = [line.strip().upper() for line in fin]
print(1 if a == b else 0)
Добавлено через 1 минуту
При условии, что каждое слово записано на отдельной строке
1
2742 / 2341 / 620
Регистрация: 19.03.2012
Сообщений: 8,830
10.03.2017, 11:12
ilyasoloma, С кодом все в порядке, только он больше для python 2, нежели чем для python 3.
Python
1
2
3
4
5
6
7
8
s = open('input.txt', encoding='utf-8').read().split()
m = s[0].upper()
l = s[1].upper()
print(m + ' : ' + l)
if m == l:
    print(1)
else:
    print(0)
Текстовый файл скинь
1
0 / 0 / 0
Регистрация: 27.09.2015
Сообщений: 16
10.03.2017, 14:24  [ТС]
Вот
Вложения
Тип файла: txt input.txt (29 байт, 21 просмотров)
0
0 / 0 / 0
Регистрация: 27.09.2015
Сообщений: 16
10.03.2017, 14:41  [ТС]
Чем он python 2 напоминает?

Добавлено через 4 минуты
Не работает
0
 Аватар для Ennjin
103 / 81 / 54
Регистрация: 25.11.2016
Сообщений: 278
10.03.2017, 15:00
ilyasoloma, Пересохраните ваш файл в кодировке utf-8
0
2742 / 2341 / 620
Регистрация: 19.03.2012
Сообщений: 8,830
10.03.2017, 15:33
ilyasoloma, твой файл в кодировке utf8 with bom, а тебе надо просто utf8. Если используешь notepad++, то при сохранении выбирай utf8 без bom и будет тебе счастье.
1
0 / 0 / 0
Регистрация: 27.09.2015
Сообщений: 16
10.03.2017, 16:06  [ТС]
Ennjin, он и есть в utf-8
0
 Аватар для Ennjin
103 / 81 / 54
Регистрация: 25.11.2016
Сообщений: 278
10.03.2017, 16:08
ilyasoloma, прочитай комент alex925
1
Эксперт Python
5438 / 3859 / 1215
Регистрация: 28.10.2013
Сообщений: 9,552
Записей в блоге: 1
10.03.2017, 18:06
Для файлов в UTF-8 with BOM в python есть отдельное наименование кодировки: encoding='utf_8_sig'.
Если указывать ее - сигнатура BOM \ufeff не будет учитываться при чтении текста из файла в этой кодировке и сравнения строк будут работать корректно.
1
2742 / 2341 / 620
Регистрация: 19.03.2012
Сообщений: 8,830
10.03.2017, 18:33
Но лучшее не использовать эту кодировку, она не популярна мягко говоря, а ut8 without bom это практически стандарт во многих местах.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
10.03.2017, 18:33
Помогаю со студенческими работами здесь

Чтение .txt файла, сохраненного в кодировке UTF-8
Привет всем! Есть .txt файл, в котором записаны 4 символа: ӮӰӴӸԊ. Файл сохранен в кодировке UTF-8. При чтении из этого файла, получается...

Чтение файлов формата .txt в кодировке utf-8
Уважаемые форумчане! Делаю скрипт для чтения и записи txt-файлов из Excel-вского файла по средствам VBA макросов. Но всё упёрлось в...

Объединить несколько TXT-файлов в кодировке UTF-8 с BOM
Прошу у вас помощи. Нужно объединить множество TXT файлов в один. Файлы в UTF-8 с BOM. COPY *.TXT ALL.XXX RENAME ALL.XXX ALL.TXT ...

Запись в файл в кодировке UTF-8
Здравствуйте, имеется фрагмент кода: QGuiApplication::setOverrideCursor(Qt::WaitCursor); QSaveFile file(_cryptFileDirectory); if...

Записать в блокнот в кодировке UTF-8
Здравствуйте, как записывать и считывать строки в кодировке UTF-8 ?


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
11
Ответ Создать тему
Новые блоги и статьи
SDL3 для Web (WebAssembly): Обработчик клика мыши в браузере ПК и касания экрана в браузере на мобильном устройстве
8Observer8 02.02.2026
Содержание блога Для начала пошагово создадим рабочий пример для подготовки к экспериментам в браузере ПК и в браузере мобильного устройства. Потом напишем обработчик клика мыши и обработчик. . .
Философия технологии
iceja 01.02.2026
На мой взгляд у человека в технических проектах остается роль генерального директора. Все остальное нейронки делают уже лучше человека. Они не могут нести предпринимательские риски, не могут. . .
SDL3 для Web (WebAssembly): Вывод текста со шрифтом TTF с помощью SDL3_ttf
8Observer8 01.02.2026
Содержание блога В этой пошаговой инструкции создадим с нуля веб-приложение, которое выводит текст в окне браузера. Запустим на Android на локальном сервере. Загрузим Release на бесплатный. . .
SDL3 для Web (WebAssembly): Сборка C/C++ проекта из консоли
8Observer8 30.01.2026
Содержание блога Если вы откроете примеры для начинающих на официальном репозитории SDL3 в папке: examples, то вы увидите, что все примеры используют следующие четыре обязательные функции, а. . .
SDL3 для Web (WebAssembly): Установка Emscripten SDK (emsdk) и CMake для сборки C и C++ приложений в Wasm
8Observer8 30.01.2026
Содержание блога Для того чтобы скачать Emscripten SDK (emsdk) необходимо сначало скачать и уставить Git: Install for Windows. Следуйте стандартной процедуре установки Git через установщик. . . .
SDL3 для Android: Подключение Box2D v3, физика и отрисовка коллайдеров
8Observer8 29.01.2026
Содержание блога Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами. Версия v3 была полностью переписана на Си, в. . .
Инструменты COM: Сохранение данный из VARIANT в файл и загрузка из файла в VARIANT
bedvit 28.01.2026
Сохранение базовых типов COM и массивов (одномерных или двухмерных) любой вложенности (деревья) в файл, с возможностью выбора алгоритмов сжатия и шифрования. Часть библиотеки BedvitCOM Использованы. . .
SDL3 для Android: Загрузка PNG с альфа-каналом с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 28.01.2026
Содержание блога SDL3 имеет собственные средства для загрузки и отображения PNG-файлов с альфа-каналом и базовой работы с ними. В этой инструкции используется функция SDL_LoadPNG(), которая. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru