Форум программистов, компьютерный форум, киберфорум
Python для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.93/15: Рейтинг темы: голосов - 15, средняя оценка - 4.93
быдлокодер
 Аватар для kravam
1724 / 911 / 106
Регистрация: 04.06.2008
Сообщений: 5,705

Как правильно вывести файл в кодировке UTF-16LE?

29.03.2017, 19:21. Показов 3709. Ответов 5
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Друзья! НА самом-то деле я всё правильно делаю. Вот код:

Python
1
2
3
4
import codecs
f = codecs.open ("foo.txt", 'r', "UTF-16LE")
for line in f:
    print(line)
Вот вывод:

Windows Batch file
1
2
3
4
5
6
7
 Раздел
 
Название
 
Последнее
 
Process finished with exit code 0
Видите пробел перед словом "Раздел"? Вот вообще не разговор! Это пробел мне очень мешает при обработке строк файла! Тем более, что этого пробела в оригинале просто напросто нет и файл foo.txt очень даже корректный и правильный файл. Вот его начало: (смотрено в hiew)
FF FE 20 04
То есть видим, что сперва идёт BOM, потом символ 0X420 (русское "Р") и так далее, никакого пробела впереди нет. В общем, как мне правильно без пробела (которого нет в оригинале) вывести этот файл? Понятное дело, что костыль не мастырить. (То есть, например, считываем построчно и потом из первой строки убираем первый символ.) Это не дело. Ведь откуда взялся этот пробел и как сделать, чтобы его никогда не было в подобном коде, я так и не пойму. Спасибо, кто откликнется.

Не раз уже просил навести порядок с пробелами, так и не наведут. В выводе в первой строке перед "Раздел", должен быть пробел, не знаю, как у вас, у меня видны кракозябры (в браузере я имею ввиду)
Вложения
Тип файла: txt foo.txt (56 байт, 5 просмотров)
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
29.03.2017, 19:21
Ответы с готовыми решениями:

getBytes('UTF-16') даёт UTF-16LE или UTF-16BE?
Добрый день! Делаю J2ME-клиента к некому серверу, исходников которого у меня нет, но есть работающий клиент на C#. Выяснилось, что C#...

Как правильно определить длину строки в кодировке UTF-8?
подскажите как в этот код добавить utf-8 ? потому что русские символы тяжелее в 2 раза. if(strlen($_POST) >= 4 &&...

Как записать файл в кодировке utf-8?
Вообщет задача такая, нужно файл записать в кодировке utf-8 или unicode и нужно чтобы русские символы считывались. Я хочу добиться чтобы...

5
Эксперт Python
5438 / 3859 / 1215
Регистрация: 28.10.2013
Сообщений: 9,552
Записей в блоге: 1
29.03.2017, 19:58
Цитата Сообщение от kravam Посмотреть сообщение
НА самом-то деле я всё правильно делаю
На самом деле нет.
Ваш пробел - это и есть BOM.
Чтобы читать файлы в UTF-16 не нужно указывать порядок байтов. Тогда python будет определять наличие в файле маркера BOM (вот тут он сам с порядком байтов и разберется) и пропускать его при выводе. И об этом четко написано у Лутца.
0
быдлокодер
 Аватар для kravam
1724 / 911 / 106
Регистрация: 04.06.2008
Сообщений: 5,705
29.03.2017, 20:04  [ТС]
Garry Galler, ну вот он мне и разобрался. Вывод без указания порядка байт:
Миниатюры
Как правильно вывести файл в кодировке UTF-16LE?  
0
Эксперт Python
5438 / 3859 / 1215
Регистрация: 28.10.2013
Сообщений: 9,552
Записей в блоге: 1
29.03.2017, 20:08
1
быдлокодер
 Аватар для kravam
1724 / 911 / 106
Регистрация: 04.06.2008
Сообщений: 5,705
29.03.2017, 20:16  [ТС]
Garry Galler, вы не ту функцию вызвали. Я вызываю codec.open, а вы просто open

P.S Написал так:

Python
1
f = codecs.open ("foo.txt", 'r', "utf16")
Вроде получается пока. Посмотрим, что будет дальше.
0
Эксперт Python
5438 / 3859 / 1215
Регистрация: 28.10.2013
Сообщений: 9,552
Записей в блоге: 1
29.03.2017, 20:18
Между open и codecs.open в 3.5 нет никакой разницы.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
29.03.2017, 20:18
Помогаю со студенческими работами здесь

Как создать файл в кодировке UTF-8?
Здравствуйте, вот так вот создаётся текстовый файлик: Dim gg, gm Set gg = CreateObject("Scripting.FileSystemObject") Set gm =...

Как записать в файл строку в кодировке UTF-8?
Здравствуйте уважаемые пользователи, модераторы и все обитатели этого форума! Нужна снова ваша помощь! Ниже представлен скрипт который...

Как можно прочитать файл текстовый в кодировке UTF-8?
Как можно прочитать файл текстовый в кодировке UTF-8?(при чтении c помощью FileSystemObject вместо русских букв другие символы)

Как вывести на экран содержимое файла в кодировке UTF-8?
Как вывести русский текст в кодировке UTF-8 из файла?

Осуществить перекодирование текста в 'UTF-16LE'
Дана текстовая строка с произвольным текстом. Осуществить перекодирование текста в 'UTF-16LE' Примеры: Ввод: Участие в Олимпиаде ...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
6
Ответ Создать тему
Новые блоги и статьи
Сумматор с применением элементов трёх состояний.
Hrethgir 26.03.2026
Тут. https:/ / fips. ru/ EGD/ ab3c85c8-836d-4866-871b-c2f0c5d77fbc Первый документ красиво выглядит, но без схемы. Это конечно не даёт никаких плюсов автору, но тем не менее. . . всё может быть. . .
Автозаполнение реквизитов при создании документа
Maks 26.03.2026
Код из решения ниже размещается в модуле объекта документа, в процедуре "ПриСозданииНаСервере". Алгоритм проверки заполнения реализован для исключения перезаписи значения реквизита, которое может. . .
Команды "Заполнить" и "Очистить" на форме документа
Maks 26.03.2026
1. Команда формы "ЗаполнитьЗапчасти". На примере нетипового документа разработанного в конфигурации КА2. В качестве источника данных указан регистр накопления, в который записываются данные о. . .
Кому нужен AOT?
DevAlt 26.03.2026
Решил сделать простой ланчер Написал заготовку: dotnet new console --aot -o UrlHandler var items = args. Split(":"); var tag = items; var id = items; var executable = args;. . .
Отправка уведомления на почту при изменении наименования справочника
Maks 24.03.2026
Программная отправка письма электронной почты на примере изменения наименования типового справочника "Склады" в конфигурации БП3. Перед реализацией необходимо выполнить настройку системной учетной. . .
модель ЗдравоСохранения 5. Меньше увольнений- больше дохода!
anaschu 24.03.2026
Теперь система здравосохранения уменьшает количество увольнений. 9TO2GP2bpX4 a42b81fb172ffc12ca589c7898261ccb/ https:/ / rutube. ru/ video/ a42b81fb172ffc12ca589c7898261ccb/ Слева синяя линия -. . .
Midnight Chicago Blues
kumehtar 24.03.2026
Такой Midnight Chicago Blues, знаешь?. . Когда вечерние улицы становятся ночными, а ты не можешь уснуть. Ты идёшь в любимый старый бар, и бармен наливает тебе виски. Ты смотришь на пролетающие. . .
SDL3 для Desktop (MinGW): Вывод текста со шрифтом TTF с помощью библиотеки SDL3_ttf на Си и C++
8Observer8 24.03.2026
Содержание блога Финальные проекты на Си и на C++: finish-text-sdl3-c. zip finish-text-sdl3-cpp. zip
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru