0 / 0 / 0
Регистрация: 04.02.2018
Сообщений: 8
1

Преобразование Unicode (UTF-16) в UTF-8 и обратно

12.02.2018, 08:29. Показов 4367. Ответов 2
Метки нет (Все метки)

Здравствуйте. Признаюсь, снова нужна подмога профессионалов.
Перейду к проблеме:
Есть файл my_list.dic в кодировке Unicode (а не UTF-8), в который надо записать слова из db.csv (эту часть я умею делать). Вот только слова-то на кодировке UTF-8!
Когда завершаю процесс записи ("a"), вижу в my_list.dic непонятные брякозавры на китайском (или японском ).
Вообщем, ВОПРОС:
-Как мне записать в файл my_list.dic данные (слова) на UTF-8?

И ещё: как обратно вернуть файлу my_list.dic после записи данных кодировку UTF-16 (Unicode)?

Пример из кода записи слов в файл:
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
import csv
 
def csv_reader(file_object):
    reader = csv.reader(file_object)
    with open(file_object, "r") as f_obj:
        for data in reader:
            with open("my_list.dic", "a") as f:
                f.write("".join(data))
                print("".join(data))
 
if __name__ == "__main__":
    csv_path = "db.csv"
    with open(csv_path, "r") as f_obj:
        csv_reader(f_obj)
Не подумайте, что я неуч. Просто я ещё ученик школы. А проект, который готовлю, нуждается в твёрдой руке Pythoner-ов.
Буду признателен за помощь
__________________
Помощь в написании контрольных, курсовых и дипломных работ, диссертаций здесь
0
Programming
Эксперт
94731 / 64177 / 26122
Регистрация: 12.04.2006
Сообщений: 116,782
12.02.2018, 08:29
Ответы с готовыми решениями:

Преобразование кодировки Unicode в UTF-8
Столкнулся просто с дичайшей проблемой: private void button1_Click(object sender, EventArgs e) ...

getBytes('UTF-16') даёт UTF-16LE или UTF-16BE?
Добрый день! Делаю J2ME-клиента к некому серверу, исходников которого у меня нет, но есть...

<globalization fileEncoding='utf-8' requestEncoding='utf-8' responseEncoding='utf-8' />
Если в коде пишу строку скажем Response.Write ('Вася дурак') - все срабатывает нормально, а если в...

Конвертация из ASCII в UTF-32 или UTF-8 в UTF-32
Собсно сабж.

2
93 / 93 / 38
Регистрация: 30.11.2017
Сообщений: 180
12.02.2018, 09:56 2
У функции open() есть параметр encoding, тпк примерно

Python
1
with open("my_list.dic", "a", encoding="utf-16")
1
Эксперт Python
4604 / 2025 / 359
Регистрация: 17.03.2012
Сообщений: 10,079
Записей в блоге: 6
12.02.2018, 14:16 3
Цитата Сообщение от chembers Посмотреть сообщение
Unicode (а не UTF-8)
UTF-8 - это один из способов записи Юникода.
Чтобы разобраться в терминологии и устройстве всего этого, я всегда ревкомендую статью Джоэла Спольски "Что каждый разработчик ПО должне знать о кодировках и таблицах символов" (или как-то так).
1
IT_Exp
Эксперт
87844 / 49110 / 22898
Регистрация: 17.06.2006
Сообщений: 92,604
12.02.2018, 14:16
Помогаю со студенческими работами здесь

Unicode to UTF-8
Собственно вопрос в шапке. Преобразовать стоку \u0412\u0430\u043b\u0435\u043d\u0442\u0438\u043d в...

From UTF-8 to UNICODE
здравствуйте!! у меня вот какой вопрос! Как сделать преобразование UTF-8 и Unicode? во общем моя...

Utf-8 to unicode
Не так давно появилась необходимость перейти с кодировки 1251 на utf-8 и теперь не могу...

Unicode и UTF-8
Всем Доброго! Объясните пожалуйста, что такое Unicode и UTF-8. Не нужно только давать ссылки на...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
3
Ответ Создать тему
Опции темы

КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2022, CyberForum.ru