Форум программистов, компьютерный форум, киберфорум
Java
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.78/9: Рейтинг темы: голосов - 9, средняя оценка - 4.78
 Аватар для parsecer
3 / 3 / 2
Регистрация: 19.07.2015
Сообщений: 74

Конвертирование строки в байты через getBytes(encoding), странные результаты

02.03.2017, 03:20. Показов 1898. Ответов 1
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Java
1
2
3
4
5
6
7
8
9
10
11
12
public static void main(String[] args) throws UnsupportedEncodingException {
    String s0="H\u00ebllo";
    String s1="Hëllo";
 
    byte[] bytes=s0.getBytes("ISO8859_1"); //72 -21 108 108 111
    //byte[] bytes=s1.getBytes("ISO8859_1"); //72 -61 -85 108 108 111
    //byte[] bytes=s0.getBytes("UTF-8");  //72 -61 -85 108 108 111
    //byte[] bytes=s1.getBytes("UTF-8");  //72 -61 -125 -62 -85 108 108 111
    for (int i=0,  i<bytes.length; i++)  {
        System.out.println(bytes[i]);
    }
}
Мне понятны первые два случая: 0xeb и 0xc3 0xab - 16-ричные кодировки символа 'ë' в ISO8859_1 и UTF-8 соответственно, переводятся в двоичную систему без знака, а потом изменятся по системе two's complement.

Java
1
2
3
ë(ISO8859_1) = 0xeb = 235 = 11101011 = -21 (two's complement for signed numbers)
 
ë (UTF-8) = 0xc3 0xab => 0xc3 = 195 = 11000011 = -61, 0xab = 171 = 10101011 = -85
Но откуда получается последний результат - лишние 2 значения: -125 -62?
И почему в случае s1.getBytes("ISO8859_1") выдаются байты UTF-8, а s1.getBytes("UTF-8") вообще что-то непонятное? В то время как в случае s0 полученные результаты соответствуют переданным в аргументах кодировкам.

PS Символ ë не отображается в коде, это https://unicode-table.com/ru/00EB/ "Латинская строчная буква e с диэризисом".
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
02.03.2017, 03:20
Ответы с готовыми решениями:

Операция обратная Encoding.GetBytes()
string str = &quot;21&quot;; byte send2 = Encoding.ASCII.GetBytes(str); Console.Write(send2); Выводит &quot;49&quot;. Как из этого обратно получить...

Есть ли в С++ аналог функции Encoding.UTF8.GetBytes(plainText) из С#?
Здравствуйте уважаемые ГУРУ! Переписываю свой код из С# на С++ Необходимо строку типа string перевести в vector&lt;unsigned char&gt;...

Какую кодировку получаем от преобразования Encoding.Unicode.GetBytes(data)
Коллеги, помогите, кто чем может, сами мы не местные... Есть некоторый клиент, написанный на C#, который делает вот такое...

1
Эксперт функциональных языков программированияЭксперт Java
 Аватар для korvin_
4575 / 2774 / 491
Регистрация: 28.04.2012
Сообщений: 8,779
02.03.2017, 08:55
Цитата Сообщение от parsecer Посмотреть сообщение
Но откуда получается последний результат - лишние 2 значения: -125 -62?
Отсюда.

Java
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
import java.nio.charset.StandardCharsets;
import java.util.Objects;
 
public final class Utf8 {
 
    public static void main(final String[] args) {
        final String s = "HГ«llo";
        final byte[] sBytes = s.getBytes(StandardCharsets.UTF_8);
        System.out.println(toBinaryString(sBytes, " "));
    }
    
    private static String toBinaryString(final byte[] bytes, final String separator) {
        Objects.requireNonNull(bytes);
        Objects.requireNonNull(separator);
        if (bytes.length == 0) {
            return "";
        }
        final StringBuilder sb = new StringBuilder((8 + separator.length()) * bytes.length);
        sb.append(toBinaryString(bytes[0]));
        for (int i = 1; i < bytes.length; i++) {
            sb.append(separator).append(toBinaryString(bytes[i]));
        }
        return sb.toString();
    }
    
    private static String toBinaryString(final byte b) {
        return String.format("%8s", Integer.toBinaryString(b & 0xFF)).replace(' ', '0');
    }
}
Code
1
01001000 11010000 10010011 11000010 10101011 01101100 01101100 01101111
1
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
02.03.2017, 08:55
Помогаю со студенческими работами здесь

Странные результаты деления
//Обнаружил странное исполнение функции деления в CodeBlocks 13.12 #include &lt;iostream&gt; #include &lt;iomanip&gt; #include...

Странные результаты поиска в Яндексе.
Решил я тут даличе поискать свой сайт в яндексе(сильно мало с него в последнее время заходят, про проблемы у яндекса знаю, но все же)...

Странные результаты проверки на чётность.
Вообщем задание такое требуеться найти у вектора наименьший не чётный элемент,и вычесть из всех элементов наименьший не чётный.Вроде бы...

Странные результаты при вычислении корней
Здравствуйте! Я тут пытаюсь написать функцию, вычисляющую корень n-ной степени(целой) числа, но получаю несколько странные результаты....

Странные результаты вычисления синусов и косинусов
На днях выполнял задание на преоброзование полярных координат в декартовские и наоборот. Столкнулся с такой проблемой, что координаты...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
2
Ответ Создать тему
Новые блоги и статьи
Камера Toupcam IUA500KMA
Eddy_Em 12.02.2026
Т. к. у всяких "хикроботов" слишком уж мелкий пиксель, для подсмотра в ESPriF они вообще плохо годятся: уже 14 величину можно рассмотреть еле-еле лишь на экспозициях под 3 секунды (а то и больше),. . .
И ясному Солнцу
zbw 12.02.2026
И ясному Солнцу, и светлой Луне. В мире покоя нет и люди не могут жить в тишине. А жить им немного лет.
«Знание-Сила»
zbw 12.02.2026
«Знание-Сила» «Время-Деньги» «Деньги -Пуля»
SDL3 для Web (WebAssembly): Подключение Box2D v3, физика и отрисовка коллайдеров
8Observer8 12.02.2026
Содержание блога Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами и вызывать обработчики событий столкновения. . . .
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 11.02.2026
Содержание блога Библиотека SDL3 содержит встроенные инструменты для базовой работы с изображениями - без использования библиотеки SDL3_image. Пошагово создадим проект для загрузки изображения. . .
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL3_image
8Observer8 10.02.2026
Содержание блога Библиотека SDL3_image содержит инструменты для расширенной работы с изображениями. Пошагово создадим проект для загрузки изображения формата PNG с альфа-каналом (с прозрачным. . .
Установка Qt-версии Lazarus IDE в Debian Trixie Xfce
volvo 10.02.2026
В общем, достали меня глюки IDE Лазаруса, собранной с использованием набора виджетов Gtk2 (конкретно: если набирать текст в редакторе и вызвать подсказку через Ctrl+Space, то после закрытия окошка. . .
SDL3 для Web (WebAssembly): Работа со звуком через SDL3_mixer
8Observer8 08.02.2026
Содержание блога Пошагово создадим проект для загрузки звукового файла и воспроизведения звука с помощью библиотеки SDL3_mixer. Звук будет воспроизводиться по клику мышки по холсту на Desktop и по. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru