Форум программистов, компьютерный форум, киберфорум
Java SE (J2SE)
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.53/34: Рейтинг темы: голосов - 34, средняя оценка - 4.53
0 / 0 / 0
Регистрация: 05.03.2016
Сообщений: 18

Вывод в консоль кодов русских букв в UTF-8

03.05.2016, 19:20. Показов 7031. Ответов 5
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Написать программу, чтобы на консоль выводила коды русских букв в UTF-8.
Есть шаблон:

Java
1
2
3
4
char ch1 = '@';
 
        int chCode = (int) ch;
        System.out.println(chCode);
Помогите, пожалуйста.
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
03.05.2016, 19:20
Ответы с готовыми решениями:

Не получается вывод в консоль русских букв
WriteLn('парам пам пам... кракозябры!!! аААаАААаааАа!!! Вывожу русский текст в консоль, а консоль печатает какие то кракозябры =( Из...

Знаки, вместо русских букв (utf-8)
Всем привет, возникла проблемка, сначало было совсем плохо не мог писать коменты на русском и категории создавать, а теперь поставил рус...

Mb_function и поддержка русских букв в кодировке UTF-8
Доброе время суток, я только-только начал познавать азы PHP. Столкнулся с проблемой поддержки русских букв. Есть задача: Первая...

5
Эксперт Java
 Аватар для turbanoff
4094 / 3828 / 745
Регистрация: 18.05.2010
Сообщений: 9,331
Записей в блоге: 12
04.05.2016, 11:15
Как-то так:
Java
1
2
3
4
5
6
7
8
9
10
11
12
13
14
        Charset utf8 = StandardCharsets.UTF_8;
        char ch1 = 'Р';
 
        byte[] bytes = Character.toString(ch1).getBytes(utf8);
        int chCode;
        if (bytes.length == 1) {
            chCode = bytes[0];
        } else if (bytes.length == 2) {
            chCode = ((bytes[0] & 0xff) << 8) | (bytes[1] & 0xff);
        } else {
            chCode = ((bytes[0] & 0xff) << 8) | ((bytes[1] & 0xff) << 8) | ((bytes[2] & 0xff) << 8) | (bytes[3] & 0xff);
        }
 
        System.out.println(chCode);
0
Эксперт функциональных языков программированияЭксперт Java
 Аватар для korvin_
4575 / 2774 / 491
Регистрация: 28.04.2012
Сообщений: 8,779
04.05.2016, 20:37
turbanoff,
1) Неправильно, в UTF-8 code point'ы могут занимать до 6 байт и в этих байтах часть бит служебные (см. схему UTF-8 в вике, например);

твой код
=> 53408

Что должно получиться:
=> 1056


2) Незачем изобретать велосипед и вообще что-либо делать с кодировками, если уже доступен char (думаю, ТС неточно сформулировал вопрос).

Не понимаю, при чём тут UTF-8
Java
1
2
3
4
        char ch1 = 'Р';
        int chCode = Character.codePointAt(new char[]{ch1}, 0);
 
        System.out.println(chCode);
=> 1056
0
Эксперт Java
 Аватар для turbanoff
4094 / 3828 / 745
Регистрация: 18.05.2010
Сообщений: 9,331
Записей в блоге: 12
04.05.2016, 22:34
korvin_, Unicode code point != закодированный символ в UTF-8
мой код выводит 53408 = 0xd0A0
Вот тут есть табличка с UTF-8, можно убедиться http://www.utf8-chartable.de/u... start=1024

С 6-ти байтовыми да, проблема. Их так просто в int не засунешь
0
Эксперт функциональных языков программированияЭксперт Java
 Аватар для korvin_
4575 / 2774 / 491
Регистрация: 28.04.2012
Сообщений: 8,779
04.05.2016, 23:00
Цитата Сообщение от turbanoff Посмотреть сообщение
Unicode code point != закодированный символ в UTF-8
Так а толку от такого представления? Тем более, что
Цитата Сообщение от turbanoff Посмотреть сообщение
С 6-ти байтовыми да, проблема.
Ну возьми long. Что с этим кодом дальше делать? Впрочем, это вопрос ТСу.
0
Эксперт Java
 Аватар для turbanoff
4094 / 3828 / 745
Регистрация: 18.05.2010
Сообщений: 9,331
Записей в блоге: 12
04.05.2016, 23:35
вывести вроде бы ему надо было. Вся кириллица (ТСу же нужны русские буквы) в 4 байта вмещается
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
04.05.2016, 23:35
Помогаю со студенческими работами здесь

Смена кодировки utf-8 на unicode у русских букв
Здравствуйте! Прошу помощи с перекодировкой строки вида &quot;\u041f\u0440\u0438\u0435\u0442&quot; в русские букафки. Голову сломал, но в течении...

Почему вместо русских букв иероглифы? ( UTF-8 )
Приветствую, форумчане. Редактирую один скрипт и в всплывающих окнах, в самой колонке (заисключением заголовков) и предупреждениях вместо...

Кодировка UTF-8 не работает, выводятся ? вместо русских букв
Добрый день, помогите, плз!! Крутила я кодировки и так и эдак и все равно выводятся знаки вопросов :( 1. прописала кодировку...

Выводит в консоль вместо русских букв квадраты
Добрый день. Подскажите пожалуйста, почему в Netbeans вместо русских букв задаваемых через консоль выводит квадраты, а русские буквы если я...

Русифицировать консоль (кракозябры вместо русских букв)
Я начинающий в С++. Вопрос такой: почему вместо того что вводишь с клавиатуры, выводится совсем не то? Вот код: #include...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
6
Ответ Создать тему
Новые блоги и статьи
SDL3 для Web (WebAssembly): Реализация движения на Box2D v3 - трение и коллизии с повёрнутыми стенами
8Observer8 20.02.2026
Содержание блога Box2D позволяет легко создать главного героя, который не проходит сквозь стены и перемещается с заданным трением о препятствия, которые можно располагать под углом, как верхнее. . .
Конвертировать закладки radiotray-ng в m3u-плейлист
damix 19.02.2026
Это можно сделать скриптом для PowerShell. Использование . \СonvertRadiotrayToM3U. ps1 <path_to_bookmarks. json> Рядом с файлом bookmarks. json появится файл bookmarks. m3u с результатом. # Check if. . .
Семь CDC на одном интерфейсе: 5 U[S]ARTов, 1 CAN и 1 SSI
Eddy_Em 18.02.2026
Постепенно допиливаю свою "многоинтерфейсную плату". Выглядит вот так: https:/ / www. cyberforum. ru/ blog_attachment. php?attachmentid=11617&stc=1&d=1771445347 Основана на STM32F303RBT6. На борту пять. . .
Камера Toupcam IUA500KMA
Eddy_Em 12.02.2026
Т. к. у всяких "хикроботов" слишком уж мелкий пиксель, для подсмотра в ESPriF они вообще плохо годятся: уже 14 величину можно рассмотреть еле-еле лишь на экспозициях под 3 секунды (а то и больше),. . .
И ясному Солнцу
zbw 12.02.2026
И ясному Солнцу, и светлой Луне. В мире покоя нет и люди не могут жить в тишине. А жить им немного лет.
«Знание-Сила»
zbw 12.02.2026
«Знание-Сила» «Время-Деньги» «Деньги -Пуля»
SDL3 для Web (WebAssembly): Подключение Box2D v3, физика и отрисовка коллайдеров
8Observer8 12.02.2026
Содержание блога Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами и вызывать обработчики событий столкновения. . . .
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 11.02.2026
Содержание блога Библиотека SDL3 содержит встроенные инструменты для базовой работы с изображениями - без использования библиотеки SDL3_image. Пошагово создадим проект для загрузки изображения. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru