3 / 3 / 2
Регистрация: 19.07.2015
Сообщений: 74
1

Конвертирование строки в байты через getBytes(encoding), странные результаты

02.03.2017, 03:20. Показов 1680. Ответов 1
Метки нет (Все метки)

Author24 — интернет-сервис помощи студентам
Java
1
2
3
4
5
6
7
8
9
10
11
12
public static void main(String[] args) throws UnsupportedEncodingException {
    String s0="H\u00ebllo";
    String s1="Hëllo";
 
    byte[] bytes=s0.getBytes("ISO8859_1"); //72 -21 108 108 111
    //byte[] bytes=s1.getBytes("ISO8859_1"); //72 -61 -85 108 108 111
    //byte[] bytes=s0.getBytes("UTF-8");  //72 -61 -85 108 108 111
    //byte[] bytes=s1.getBytes("UTF-8");  //72 -61 -125 -62 -85 108 108 111
    for (int i=0,  i<bytes.length; i++)  {
        System.out.println(bytes[i]);
    }
}
Мне понятны первые два случая: 0xeb и 0xc3 0xab - 16-ричные кодировки символа 'ë' в ISO8859_1 и UTF-8 соответственно, переводятся в двоичную систему без знака, а потом изменятся по системе two's complement.

Java
1
2
3
ë(ISO8859_1) = 0xeb = 235 = 11101011 = -21 (two's complement for signed numbers)
 
ë (UTF-8) = 0xc3 0xab => 0xc3 = 195 = 11000011 = -61, 0xab = 171 = 10101011 = -85
Но откуда получается последний результат - лишние 2 значения: -125 -62?
И почему в случае s1.getBytes("ISO8859_1") выдаются байты UTF-8, а s1.getBytes("UTF-8") вообще что-то непонятное? В то время как в случае s0 полученные результаты соответствуют переданным в аргументах кодировкам.

PS Символ ë не отображается в коде, это https://unicode-table.com/ru/00EB/ "Латинская строчная буква e с диэризисом".
0
Programming
Эксперт
94731 / 64177 / 26122
Регистрация: 12.04.2006
Сообщений: 116,782
02.03.2017, 03:20
Ответы с готовыми решениями:

Операция обратная Encoding.GetBytes()
string str = &quot;21&quot;; byte send2 = Encoding.ASCII.GetBytes(str); Console.Write(send2); Выводит...

Есть ли в С++ аналог функции Encoding.UTF8.GetBytes(plainText) из С#?
Здравствуйте уважаемые ГУРУ! Переписываю свой код из С# на С++ Необходимо строку типа string...

Какую кодировку получаем от преобразования Encoding.Unicode.GetBytes(data)
Коллеги, помогите, кто чем может, сами мы не местные... Есть некоторый клиент, написанный на C#,...

Странные результаты деления
//Обнаружил странное исполнение функции деления в CodeBlocks 13.12 #include &lt;iostream&gt;...

1
Эксперт функциональных языков программированияЭксперт Java
4483 / 2718 / 485
Регистрация: 28.04.2012
Сообщений: 8,585
02.03.2017, 08:55 2
Цитата Сообщение от parsecer Посмотреть сообщение
Но откуда получается последний результат - лишние 2 значения: -125 -62?
Отсюда.

Java
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
import java.nio.charset.StandardCharsets;
import java.util.Objects;
 
public final class Utf8 {
 
    public static void main(final String[] args) {
        final String s = "HГ«llo";
        final byte[] sBytes = s.getBytes(StandardCharsets.UTF_8);
        System.out.println(toBinaryString(sBytes, " "));
    }
    
    private static String toBinaryString(final byte[] bytes, final String separator) {
        Objects.requireNonNull(bytes);
        Objects.requireNonNull(separator);
        if (bytes.length == 0) {
            return "";
        }
        final StringBuilder sb = new StringBuilder((8 + separator.length()) * bytes.length);
        sb.append(toBinaryString(bytes[0]));
        for (int i = 1; i < bytes.length; i++) {
            sb.append(separator).append(toBinaryString(bytes[i]));
        }
        return sb.toString();
    }
    
    private static String toBinaryString(final byte b) {
        return String.format("%8s", Integer.toBinaryString(b & 0xFF)).replace(' ', '0');
    }
}
Код
01001000 11010000 10010011 11000010 10101011 01101100 01101100 01101111
1
02.03.2017, 08:55
IT_Exp
Эксперт
87844 / 49110 / 22898
Регистрация: 17.06.2006
Сообщений: 92,604
02.03.2017, 08:55
Помогаю со студенческими работами здесь

Странные результаты поиска в Яндексе.
Решил я тут даличе поискать свой сайт в яндексе(сильно мало с него в последнее время заходят, про...

Странные результаты проверки на чётность.
Вообщем задание такое требуеться найти у вектора наименьший не чётный элемент,и вычесть из всех...

Странные результаты при вычислении корней
Здравствуйте! Я тут пытаюсь написать функцию, вычисляющую корень n-ной степени(целой) числа, но...

Странные результаты вычисления синусов и косинусов
На днях выполнял задание на преоброзование полярных координат в декартовские и наоборот. Столкнулся...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
2
Ответ Создать тему
Опции темы

КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2024, CyberForum.ru