Форум программистов, компьютерный форум, киберфорум
C++ Builder
Войти
Регистрация
Восстановить пароль
 
18 / 18 / 7
Регистрация: 20.03.2012
Сообщений: 521
1

JSON с русским текстом в юникоде

09.04.2020, 00:55. Просмотров 214. Ответов 5
Метки нет (Все метки)

Экспериментирую как можно было бы выводить данные в json-формате непосредственно в файл с двумя обязательными условиями:
1) Поддержка русского языка в формате Юникода (UTF16 или UTF8)
2) Вывод без посредников (т.е. без DOM, стринг листов и т.п.)
Пробую так:
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
    std::auto_ptr<TFileStream> DestFileStream(new TFileStream("Sample.json", fmCreate));
    std::auto_ptr<TJsonTextWriter> Writer( new TJsonTextWriter( DestFileStream.get()) );
 
    try
    {
        Writer->Formatting = TJsonFormatting::Indented;
 
        Writer->WriteStartObject();
 
        Writer->WritePropertyName(L"name");
        Writer->WriteValue( String(L"Русский текст") );
        Writer->WritePropertyName(L"id");
        Writer->WriteValue( 123 );
 
        Writer->WriteEndObject();
    }
    catch(...)
    {
        ShowMessage(L"Что-то пошло не так");
    }
Работает, за исключением одного но:
В результирующем файле текст записывается как отдельные юникод символы:
JSON
1
2
3
4
{
    "name": "\u0420\u0443\u0441\u0441\u043A\u0438\u0439 \u0442\u0435\u043A\u0441\u0442",
    "id": 123
}
А хотелось бы, чтобы было видно в виде обычного текста, чтобы было читабельно и для человека тоже.

Добавлено через 1 час 22 минуты
Заменил TFileStream на TStreamWriter с указанием кодировки TEncoding::UTF8.
Все стало работать, как нужно.
0
Programming
Эксперт
94731 / 64177 / 26122
Регистрация: 12.04.2006
Сообщений: 116,782
09.04.2020, 00:55
Ответы с готовыми решениями:

Blob с русским текстом
Всем привет! Есть csv файл, который записан в базе в blob. Нужно распарсить каждую строчку, взяв...

idhttp - работа с русским текстом
Проблема такая strRead = Http1-&gt;Get(strURL); русские буквы считываются каракулями - как их...

Сохранение вебстраницы с русским текстом
написал код:using System; using System.Collections.Generic; using System.ComponentModel; using...

Проблема с русским текстом в форме
С некоторых пор введенный по-русски текст из формы передается в таком виде...

5
фрилансер
1202 / 800 / 245
Регистрация: 11.10.2019
Сообщений: 2,629
09.04.2020, 07:47 2
znseday, храни внутри json всегда только utf8 и забудь проблемы. Юникодную строку можно перевести в utf8. Если нужно запихнуть любые бинарные данные, переведи их в base64
0
18 / 18 / 7
Регистрация: 20.03.2012
Сообщений: 521
09.04.2020, 23:18  [ТС] 3
Алексей1153, так я сам за utf-8. И, на сколько я понял, открытие TStreamWriter с указанием кодировки TEncoding::UTF8 как раз и решает все проблемы автоматически.
Вопрос, разве что в том, на сколько json в utf-8 распространен с точки зрения внешнего (не билдеровского) мира?
0
фрилансер
1202 / 800 / 245
Регистрация: 11.10.2019
Сообщений: 2,629
09.04.2020, 23:30 4
znseday, согласно моему опыту общения с json - где бы я его не встречал, везде json и utf8 - это неразлучные братья. Вот насчёт билдера - не знаю. как там принято

Writer->WriteValue( String(L"Русский текст") );
тут у тебя используется юникодная строка . об этом говорит 'L' перед строкой. Нужно перегонять в utf8 "местными" функциями. Или, если компилятор поддерживает новый стандарт, указать префикс u8 (строковые литералы)
0
18 / 18 / 7
Регистрация: 20.03.2012
Сообщений: 521
09.04.2020, 23:41  [ТС] 5
Да, WriteValue принимает UnicodeString. Но суть не в нем, а в том, что вообще весь json файл (не только строковые значения) записывается в utf-8.
Во всяком случае, это видно, если открыть полученных файл в Notepad++.

Добавлено через 6 минут
Причем, он туда еще и BOM прописывает. Не знаю, насколько это хорошо...
0
фрилансер
1202 / 800 / 245
Регистрация: 11.10.2019
Сообщений: 2,629
09.04.2020, 23:45 6
Цитата Сообщение от znseday Посмотреть сообщение
весь json файл (не только строковые значения) записывается в utf-8.
это нормально
0
IT_Exp
Эксперт
87844 / 49110 / 22898
Регистрация: 17.06.2006
Сообщений: 92,604
09.04.2020, 23:45

Заказываю контрольные, курсовые, дипломные и любые другие студенческие работы здесь.

Работа с русским текстом в linux
Пишу консольное приложение в Code::Blocks на Ubuntu 15.04. Выводит он русский текст и без всяких...

Как исправить ошибку с русским текстом
Если ввожу логин английскими то все работает нормально, а если ввожу логин русскими, то происходит...

SELECT не находит строку с русским текстом
Есть база данных в кодировке utf8: Структура 1 id int(12) UNSIGNED Нет Нет ...

Preg_replace не работает с русским текстом и case insensetive
Здравствуйте! Как я понял, тема известная. Гугл, в основном, выдает ссылки на темы как минимум...

При сохранение из Mathcad 15 в 11 проблема с русским текстом
При сохранение документа из Mathcad 15 в Mathcad 11 пропадает русский текст, вместо него &quot;?&quot;. ...

Проблемы с русским текстом при получении его из полей
Добрый день. Имеется следующая проблема: Если русский текст указан напрямую в коде разметки, то...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
6
Ответ Создать тему
Опции темы

КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2020, vBulletin Solutions, Inc.