Форум программистов, компьютерный форум, киберфорум
C++ Builder
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.85/13: Рейтинг темы: голосов - 13, средняя оценка - 4.85
18 / 18 / 7
Регистрация: 20.03.2012
Сообщений: 585

JSON с русским текстом в юникоде

09.04.2020, 00:55. Показов 2592. Ответов 5
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Экспериментирую как можно было бы выводить данные в json-формате непосредственно в файл с двумя обязательными условиями:
1) Поддержка русского языка в формате Юникода (UTF16 или UTF8)
2) Вывод без посредников (т.е. без DOM, стринг листов и т.п.)
Пробую так:
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
    std::auto_ptr<TFileStream> DestFileStream(new TFileStream("Sample.json", fmCreate));
    std::auto_ptr<TJsonTextWriter> Writer( new TJsonTextWriter( DestFileStream.get()) );
 
    try
    {
        Writer->Formatting = TJsonFormatting::Indented;
 
        Writer->WriteStartObject();
 
        Writer->WritePropertyName(L"name");
        Writer->WriteValue( String(L"Русский текст") );
        Writer->WritePropertyName(L"id");
        Writer->WriteValue( 123 );
 
        Writer->WriteEndObject();
    }
    catch(...)
    {
        ShowMessage(L"Что-то пошло не так");
    }
Работает, за исключением одного но:
В результирующем файле текст записывается как отдельные юникод символы:
JSON
1
2
3
4
{
    "name": "\u0420\u0443\u0441\u0441\u043A\u0438\u0439 \u0442\u0435\u043A\u0441\u0442",
    "id": 123
}
А хотелось бы, чтобы было видно в виде обычного текста, чтобы было читабельно и для человека тоже.

Добавлено через 1 час 22 минуты
Заменил TFileStream на TStreamWriter с указанием кодировки TEncoding::UTF8.
Все стало работать, как нужно.
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
09.04.2020, 00:55
Ответы с готовыми решениями:

Blob с русским текстом
Всем привет! Есть csv файл, который записан в базе в blob. Нужно распарсить каждую строчку, взяв части между ';'. С английскими...

idhttp - работа с русским текстом
Проблема такая strRead = Http1-&gt;Get(strURL); русские буквы считываются каракулями - как их перевести или считать в нормальном виде?

Сохранение вебстраницы с русским текстом
написал код:using System; using System.Collections.Generic; using System.ComponentModel; using System.Data; using System.Drawing; ...

5
фрилансер
 Аватар для Алексей1153
6444 / 5637 / 1128
Регистрация: 11.10.2019
Сообщений: 14,995
09.04.2020, 07:47
znseday, храни внутри json всегда только utf8 и забудь проблемы. Юникодную строку можно перевести в utf8. Если нужно запихнуть любые бинарные данные, переведи их в base64
0
18 / 18 / 7
Регистрация: 20.03.2012
Сообщений: 585
09.04.2020, 23:18  [ТС]
Алексей1153, так я сам за utf-8. И, на сколько я понял, открытие TStreamWriter с указанием кодировки TEncoding::UTF8 как раз и решает все проблемы автоматически.
Вопрос, разве что в том, на сколько json в utf-8 распространен с точки зрения внешнего (не билдеровского) мира?
0
фрилансер
 Аватар для Алексей1153
6444 / 5637 / 1128
Регистрация: 11.10.2019
Сообщений: 14,995
09.04.2020, 23:30
znseday, согласно моему опыту общения с json - где бы я его не встречал, везде json и utf8 - это неразлучные братья. Вот насчёт билдера - не знаю. как там принято

Writer->WriteValue( String(L"Русский текст") );
тут у тебя используется юникодная строка . об этом говорит 'L' перед строкой. Нужно перегонять в utf8 "местными" функциями. Или, если компилятор поддерживает новый стандарт, указать префикс u8 (строковые литералы)
0
18 / 18 / 7
Регистрация: 20.03.2012
Сообщений: 585
09.04.2020, 23:41  [ТС]
Да, WriteValue принимает UnicodeString. Но суть не в нем, а в том, что вообще весь json файл (не только строковые значения) записывается в utf-8.
Во всяком случае, это видно, если открыть полученных файл в Notepad++.

Добавлено через 6 минут
Причем, он туда еще и BOM прописывает. Не знаю, насколько это хорошо...
0
фрилансер
 Аватар для Алексей1153
6444 / 5637 / 1128
Регистрация: 11.10.2019
Сообщений: 14,995
09.04.2020, 23:45
Цитата Сообщение от znseday Посмотреть сообщение
весь json файл (не только строковые значения) записывается в utf-8.
это нормально
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
09.04.2020, 23:45
Помогаю со студенческими работами здесь

Проблема с русским текстом в форме
С некоторых пор введенный по-русски текст из формы передается в таком виде %CF%F0%EE%E1%EB%E5%EC%E0... как это вылечить?

Работа с русским текстом в linux
Пишу консольное приложение в Code::Blocks на Ubuntu 15.04. Выводит он русский текст и без всяких функций, а вот с чтением проблема,...

Как исправить ошибку с русским текстом
Если ввожу логин английскими то все работает нормально, а если ввожу логин русскими, то происходит какой то глюк с прочтением русского...

SELECT не находит строку с русским текстом
Есть база данных в кодировке utf8: Структура 1 id int(12) UNSIGNED Нет Нет AUTO_INCREMENT 2 name ...

Preg_replace не работает с русским текстом и case insensetive
Здравствуйте! Как я понял, тема известная. Гугл, в основном, выдает ссылки на темы как минимум двухлетней давности, php 5.3, 5.4. У меня...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
6
Ответ Создать тему
Новые блоги и статьи
Thinkpad X220 Tablet — это лучший бюджетный ноутбук для учёбы, точка.
Programma_Boinc 23.12.2025
Thinkpad X220 Tablet — это лучший бюджетный ноутбук для учёбы, точка. Рецензия / Мнение Это мой обзор планшета X220 с точки зрения школьника. Недавно я решила попытаться уменьшить свой. . .
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта Симптом: После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
Как объединить две одинаковые БД Access с разными данными
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином. Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов. . . .
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru