1 / 1 / 0
Регистрация: 13.10.2012
Сообщений: 125

Работа с кодировкой вида "u0430\u0434\" в HttpResponce ответах

22.04.2015, 15:15. Показов 3346. Ответов 1
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Приветствую! возникла странная проблема.

В ответах от хттп сервера я получаю контент, в котором кириллица отображается символами вида "u0430\u0434\u0430"

Цель - встроить декодирование ответов содежржащих такой контент в нормальный читабельный вид.
Нашел такое решение, работает (только при задании значения переменной напрямую, как в примере)
C#
1
2
                string data = "\u0430\u0434\u0440\u0435\u0441\u0430";
                string result = Encoding.GetEncoding(65001).GetString(Encoding.GetEncoding(65001).GetBytes(data));
в коде ответа так же содержатся спецсимволы и т.д. вида
C#
1
{"reports":[{"text":"\
, так что приминительно ко всему контенту оно не работает.
Это не очень критичный момент, части контента, содержащие эти символы могу вылавливать Regex`ом.

Проблема:
Решение работает только в случае, если символы вида "u0430\u0434\u0430" я присваиваю напрямую переменной, как это написано в примере выше.

Тестировал:
  • -при вытаскивании из возращаемого ответом контента страницы частей, содержащих эти символы(кстати так и не нашел, как они вообще называются?) и дальнейшему применению способа, описанного выше к ним, получаю, при разных вариациях либо эти же символы неизменными, либо пустую переменную.
  • -при сохранении ответа в файл, затем применение способа, описанного выше к нему - получаю эти символы неизменными.
  • -При сохранении ответа в файл, затем открытии его руками в блокноте -> выбора руками например символов "u0435\u0441\u0430" -> Найти -> "u0435\u0441\u0430", получаю положительный результат "найдено".
    При считывании контента из файла в софте, получаю "False"
    C#
    1
    2
    3
    
                 string data = File.ReadAllText(@"D:\Projects\*******\Debug\1.txt", Encoding.GetEncoding(65001));
                    string token = "u0435\u0441\u0430";
                    log(data.Contains(token).ToString());
    (Encoding.GetEncoding(1251)) так же применялось.

На крайний случай - хотябы сделать рабочим поиск по строке содержащий эти символы, тогда смогу оперировать результатами в духе содержит/нет символы "u0435\u0441\u0430".

Добавлено через 9 минут
  • add:
  • -пробовал определять кодировку контента возвращаемого хттпзапросом, методом, описанным здесь http://stackoverflow.com/quest... in-c-sharp . Получаю релузьтат "Unicode".
  • -пробовал применять коды других юникод кодировок, а также криллицы отсюда https://msdn.microsoft.com/en-... 10%29.aspx
  • -хедеры "Accept-Charset" в запросах имеют значение "windows-1251,utf-8;q=0.7,*;q=0.3", значит вроде бы других кодировок возвращаться не должно в ответе
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
22.04.2015, 15:15
Ответы с готовыми решениями:

С кодировкой базы данных и кодировкой сайтом и кодировкой файла разобраться не могу
С кодировкой базы данных и сайтом файлом разобраться не могу. Я на своем сайте вывожу данные из другой mysql.... МММ сайт на win 1251 а...

Построить три вида фигуры. На месте вида спереди и вида слева совместить часть вида с частью разреза

Построить три вида фигуры. На месте вида спереди и вида слева совместить часть вида с частью разреза - AutoCAD
Меня уже совсем выносит. Правильно ли я делаю?.. Не могу представить нормально вид слева. Что делаю не так? До второй фигуры даже и не...

1
Эксперт .NET
 Аватар для kolorotur
17823 / 12973 / 3382
Регистрация: 17.09.2011
Сообщений: 21,261
22.04.2015, 15:56
Цитата Сообщение от opahopa Посмотреть сообщение
JSON
1
{"reports":[{"text":"\
Это ж вы JSON обычный получаете, там символы юникода таким образом кодируются.

Чтобы не изобретать велосипеды, обрабатывайте запрос любым JSON-парсером (Newtonsoft JSON.Net хороший).
1
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
22.04.2015, 15:56
Помогаю со студенческими работами здесь

\u0421\u043a\u0430\u0439\u0440\u0438\u043c - что это?
Столкнулся с такой проблемой - все русские\юникод символы на одном сайте преобразуются вот в такой вид. Здесь например в ...

работа с кодировкой
Может кто-нибудь предоставить инфомацию с 16-ричной кодирвкой? Мне надо чтобы в textbox-e ввелось число, а в программе оно записано не в...

Работа с кодировкой
Есть генератор паролей, который выдает текстовый файл с 20 восьмисимвольными паролями. В качестве символов должны использоваться английский...

Работа с кодировкой дефолтных значений
Всем доброго времени суток. У меня вопрос по кодировке. Я работаю с ini файлами(сделал отдельным классом одиночкой) и при помощи...

Работа с кодировкой в самом приложении
Всем привет! Есть приложение(react-native). На экране расположены: TextInput, Button и Text(с TouchableOpacity). Идея заключается в...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
2
Ответ Создать тему
Опции темы

Новые блоги и статьи
Валидация и контроль данных табличной части документа перед записью
Maks 22.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа, разработанного в КА2. Задача: контроль и валидация данных табличной части документа перед записью с учетом регламента компании. . .
Отчёт о затраченных материалах за определенный период с макетом печатной формы
Maks 21.04.2026
Отчёт из решения ниже размещён в конфигурации КА2. Задача: разработка отчёта по затраченным материалам за определённый период, с возможностью вывода печатной формы отчёта с шапкой и подвалом. В. . .
Отчёт о спецтехнике находящейся в ремонте
Maks 20.04.2026
Отчёт из решения ниже размещен в конфигурации КА2. Задача: отобразить спецтехнику, которая на данный момент находится в ремонте. Есть нетиповой документ "Заявка на ремонт спецтехники" который. . .
Памятка для бота и "визитка" для читателей "Semantic Universe Layer (Слой семантической вселенной)"
Hrethgir 19.04.2026
Сгенерировано для краткого описания по случаю сборки и компиляции скелета серверного приложения. И пусть после этого скажут, что статьи сгенерированные AI - туфта и не интересно. И это не реклама -. . .
Запрет удаления строк ТЧ документа при определённом условии
Maks 19.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "Аккумуляторы", разработанного в конфигурации КА2. У данного документа есть ТЧ, в которой в зависимости от прав доступа. . .
Модель заражения группы наркоманов
alhaos 17.04.2026
Условия задачи сформулированы тут Суть: - Группа наркоманов из 10 человек. - Только один инфицирован ВИЧ. - Колются одной иглой. - Колются раз в день. - Колются последовательно через. . .
Мысли в слух. Про "навсегда".
kumehtar 16.04.2026
Подумалось тут, что наверное очень глупо использовать во всяких своих установках понятие "навсегда". Это очень сильное понятие, и я только начинаю понимать край его смысла, не смотря на то что давно. . .
My Business CRM
MaGz GoLd 16.04.2026
Всем привет, недавно возникла потребность создать CRM, для личных нужд. Собственно программа предоставляет из себя базу данных клиентов, в которой можно фиксировать звонки, стадии сделки, а также. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru