Форум программистов, компьютерный форум, киберфорум
Java
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.78/9: Рейтинг темы: голосов - 9, средняя оценка - 4.78
 Аватар для parsecer
3 / 3 / 2
Регистрация: 19.07.2015
Сообщений: 74

Конвертирование строки в байты через getBytes(encoding), странные результаты

02.03.2017, 03:20. Показов 1873. Ответов 1
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Java
1
2
3
4
5
6
7
8
9
10
11
12
public static void main(String[] args) throws UnsupportedEncodingException {
    String s0="H\u00ebllo";
    String s1="Hëllo";
 
    byte[] bytes=s0.getBytes("ISO8859_1"); //72 -21 108 108 111
    //byte[] bytes=s1.getBytes("ISO8859_1"); //72 -61 -85 108 108 111
    //byte[] bytes=s0.getBytes("UTF-8");  //72 -61 -85 108 108 111
    //byte[] bytes=s1.getBytes("UTF-8");  //72 -61 -125 -62 -85 108 108 111
    for (int i=0,  i<bytes.length; i++)  {
        System.out.println(bytes[i]);
    }
}
Мне понятны первые два случая: 0xeb и 0xc3 0xab - 16-ричные кодировки символа 'ë' в ISO8859_1 и UTF-8 соответственно, переводятся в двоичную систему без знака, а потом изменятся по системе two's complement.

Java
1
2
3
ë(ISO8859_1) = 0xeb = 235 = 11101011 = -21 (two's complement for signed numbers)
 
ë (UTF-8) = 0xc3 0xab => 0xc3 = 195 = 11000011 = -61, 0xab = 171 = 10101011 = -85
Но откуда получается последний результат - лишние 2 значения: -125 -62?
И почему в случае s1.getBytes("ISO8859_1") выдаются байты UTF-8, а s1.getBytes("UTF-8") вообще что-то непонятное? В то время как в случае s0 полученные результаты соответствуют переданным в аргументах кодировкам.

PS Символ ë не отображается в коде, это https://unicode-table.com/ru/00EB/ "Латинская строчная буква e с диэризисом".
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
02.03.2017, 03:20
Ответы с готовыми решениями:

Операция обратная Encoding.GetBytes()
string str = &quot;21&quot;; byte send2 = Encoding.ASCII.GetBytes(str); Console.Write(send2); Выводит &quot;49&quot;. Как из этого обратно получить...

Есть ли в С++ аналог функции Encoding.UTF8.GetBytes(plainText) из С#?
Здравствуйте уважаемые ГУРУ! Переписываю свой код из С# на С++ Необходимо строку типа string перевести в vector&lt;unsigned char&gt;...

Какую кодировку получаем от преобразования Encoding.Unicode.GetBytes(data)
Коллеги, помогите, кто чем может, сами мы не местные... Есть некоторый клиент, написанный на C#, который делает вот такое...

1
Эксперт функциональных языков программированияЭксперт Java
 Аватар для korvin_
4575 / 2773 / 491
Регистрация: 28.04.2012
Сообщений: 8,760
02.03.2017, 08:55
Цитата Сообщение от parsecer Посмотреть сообщение
Но откуда получается последний результат - лишние 2 значения: -125 -62?
Отсюда.

Java
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
import java.nio.charset.StandardCharsets;
import java.util.Objects;
 
public final class Utf8 {
 
    public static void main(final String[] args) {
        final String s = "HГ«llo";
        final byte[] sBytes = s.getBytes(StandardCharsets.UTF_8);
        System.out.println(toBinaryString(sBytes, " "));
    }
    
    private static String toBinaryString(final byte[] bytes, final String separator) {
        Objects.requireNonNull(bytes);
        Objects.requireNonNull(separator);
        if (bytes.length == 0) {
            return "";
        }
        final StringBuilder sb = new StringBuilder((8 + separator.length()) * bytes.length);
        sb.append(toBinaryString(bytes[0]));
        for (int i = 1; i < bytes.length; i++) {
            sb.append(separator).append(toBinaryString(bytes[i]));
        }
        return sb.toString();
    }
    
    private static String toBinaryString(final byte b) {
        return String.format("%8s", Integer.toBinaryString(b & 0xFF)).replace(' ', '0');
    }
}
Code
1
01001000 11010000 10010011 11000010 10101011 01101100 01101100 01101111
1
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
02.03.2017, 08:55
Помогаю со студенческими работами здесь

Странные результаты деления
//Обнаружил странное исполнение функции деления в CodeBlocks 13.12 #include &lt;iostream&gt; #include &lt;iomanip&gt; #include...

Странные результаты поиска в Яндексе.
Решил я тут даличе поискать свой сайт в яндексе(сильно мало с него в последнее время заходят, про проблемы у яндекса знаю, но все же)...

Странные результаты проверки на чётность.
Вообщем задание такое требуеться найти у вектора наименьший не чётный элемент,и вычесть из всех элементов наименьший не чётный.Вроде бы...

Странные результаты при вычислении корней
Здравствуйте! Я тут пытаюсь написать функцию, вычисляющую корень n-ной степени(целой) числа, но получаю несколько странные результаты....

Странные результаты вычисления синусов и косинусов
На днях выполнял задание на преоброзование полярных координат в декартовские и наоборот. Столкнулся с такой проблемой, что координаты...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
2
Ответ Создать тему
Новые блоги и статьи
Access
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином. Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов. . . .
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
Создание Single Page Application на фреймах
krapotkin 16.11.2025
Статья исключительно для начинающих. Подходы оригинальностью не блещут. В век Веб все очень привыкли к дизайну Single-Page-Application . Быстренько разберем подход "на фреймах". Мы делаем одну. . .
Фото: Daniel Greenwood
kumehtar 13.11.2025
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru