14 / 14 / 1
Регистрация: 17.08.2015
Сообщений: 460

Получить ASCII код русских букв

17.10.2016, 14:36. Показов 26985. Ответов 17
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Нужно получить код аски кода русского символа. Казалось бы, ничего сложного, но.
Первая проблема заключается в том, что у меня не очень корректно работает ввод и вывод русских символов в консоли. Когда я ввожу что-нибудь русское в консоль - отображается и выводится нормально, но если я пропишу русские символы в самом коде в строковой переменной, то выводит кракозябры.

Вот код:
C++ (Qt)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
#include <iostream>
#include <Windows.h>
using namespace std;
 
int main(int argc, char* argv[])
{
    SetConsoleCP(1251);// установка кодовой страницы win-cp 1251 в поток ввода
    SetConsoleOutputCP(1251); // установка кодовой страницы win-cp 1251 в поток вывода
 
    char string[20]={"абвгд"};
  //  cin >> string; // вводим строку, используя Кириллицу
    cout << string << endl; // ввывод строки
    cout<<string[3]<<endl;
    for(auto i:string){
        int cc=char(string[i]);
        cout<<cc<<endl;
    }
    return 0;
}
вывод такой:
кракозябры
а потом:
10
32
10
0
10
0
10
0
10
0
-48
-48
-48
-48
-48
-48
-48
-48
-48
-48

А шаг как известно у ascii "абвгд" должен быть единичным. В чем тут дело?
0
Лучшие ответы (1)
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
17.10.2016, 14:36
Ответы с готовыми решениями:

Номера русских букв в ASCII
Почему такой код setlocale (LC_ALL, &quot;rus&quot; ); cout&lt;&lt;static_cast&lt;char&gt;(231)&lt;&lt;endl; cout&lt;&lt;static_cast&lt;int&gt;('з')&lt;&lt;endl; char...

Консольный вывод расширенной ASCII и русских букв
Извиняюсь, если подобные темы уже есть, но с помощью поиска получить ответ на свой вопрос я не смог. Собственно, вот и он: Мне...

ASCII игра из русских символов
В общем решил написать небольшую консольную игру, все игровые объекты будут отображаться символами из таблицы ASCII, интерфейс будет на...

17
13 / 13 / 9
Регистрация: 24.09.2016
Сообщений: 74
17.10.2016, 14:52
Насколько знаю, нужно поменять шрифт в консоле.
Выбрать шрифт Lucida Console или Consolas.
0
14 / 14 / 1
Регистрация: 17.08.2015
Сообщений: 460
17.10.2016, 14:53  [ТС]
Конечно, я уже поменял на Lucida
0
nd2
3438 / 2817 / 1249
Регистрация: 29.01.2016
Сообщений: 9,427
17.10.2016, 14:55
Цитата Сообщение от Blitzor DDD Посмотреть сообщение
Конечно, я уже поменял на Lucida
Среда какая?
0
14 / 14 / 1
Регистрация: 17.08.2015
Сообщений: 460
17.10.2016, 14:56  [ТС]
Qt Creator
0
7804 / 6568 / 2988
Регистрация: 14.04.2014
Сообщений: 28,705
17.10.2016, 14:57
Надо приводить к беззнаковому char:
C++
1
int cc = static_cast<unsigned char>(string[i]);
А в Qt юникод используется. Там QString надо перекодировать - toLocal8Bit().
0
Диссидент
Эксперт C
 Аватар для Байт
27714 / 17332 / 3810
Регистрация: 24.12.2010
Сообщений: 38,978
17.10.2016, 14:58
C++
1
2
3
4
for(int i=0; string[i]; i++) {
  int cc = (unsigned char) string[i];
  cout << cc << endl;
}
0
nd2
3438 / 2817 / 1249
Регистрация: 29.01.2016
Сообщений: 9,427
17.10.2016, 14:58
Цитата Сообщение от Blitzor DDD Посмотреть сообщение
C++
1
2
3
4
for(auto i:string){
int cc=char(string[i]);
cout<<cc<<endl;
}
Ты что здесь, собственно, делаешь?
0
Диссидент
Эксперт C
 Аватар для Байт
27714 / 17332 / 3810
Регистрация: 24.12.2010
Сообщений: 38,978
17.10.2016, 15:00
Можно сразу
C++
1
unsigned char string[20]={"абвгд"};
0
14 / 14 / 1
Регистрация: 17.08.2015
Сообщений: 460
17.10.2016, 15:03  [ТС]
Теперь код такой:
C++ (Qt)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
#include <iostream>
#include <Windows.h>
using namespace std;
 
int main(int argc, char* argv[])
{
    SetConsoleCP(1251);// установка кодовой страницы win-cp 1251 в поток ввода
    SetConsoleOutputCP(1251); // установка кодовой страницы win-cp 1251 в поток вывода
 
    unsigned char string[20]={"абвгд"};
  //  cin >> string; // вводим строку, используя Кириллицу
    cout << string << endl; // ввывод строки
    cout<<string[3]<<endl;
    for(int i=0; string[i]; i++) {
      int cc = (unsigned char) string[i];
      cout << cc << endl;
    }
    return 0;
}
но вывод все равно неправильный:
кракозябры
208
176
208
177
208
178
208
179
208
180
откуда здесь 208?
0
7804 / 6568 / 2988
Регистрация: 14.04.2014
Сообщений: 28,705
17.10.2016, 15:07
Я же тебе сказал: в Qt юникод, а ты мыслишь древними понятиями. Твоя строка будет в utf-8. Используй QString и перекодируй, как я написал выше.
0
Диссидент
Эксперт C
 Аватар для Байт
27714 / 17332 / 3810
Регистрация: 24.12.2010
Сообщений: 38,978
17.10.2016, 15:10
Блин, в Куте ведь UTF-16.
Тогда уж как-то через toLocal8bit и аналоги. С деталями разбирайся сам. Или жди, когда подвалит кто-то в этом деле покомпетентнее...
0
14 / 14 / 1
Регистрация: 17.08.2015
Сообщений: 460
17.10.2016, 15:18  [ТС]
C++ (Qt)
1
2
3
4
5
6
7
 QString sss("aAбБвгд");
    sss.toLocal8Bit();
    for(int i=0;i<sss.length();i++){
     int cc= (unsigned char) sss[i];
      cout<<cc<<endl;
        
    }
Цитата Сообщение от nmcf Посмотреть сообщение
Твоя строка будет в utf-8. Используй QString и перекодируй
Цитата Сообщение от Байт Посмотреть сообщение
Тогда уж как-то через toLocal8bit и аналоги.
так тоже не получается что-то.

Не понимаю я тонкостей тут. toStdString, toStdU1String, toLocal16Bit() и пр.
Разные варианты пробовать вместо sss.toLocal8Bit();?
0
7804 / 6568 / 2988
Регистрация: 14.04.2014
Сообщений: 28,705
17.10.2016, 15:23
Лучший ответ Сообщение было отмечено Blitzor DDD как решение

Решение

C++ (Qt)
1
2
3
4
5
6
7
8
9
 QString sss("aAбБвгд");
 QByteArray a = sss.toLocal8Bit();
 
    for(int i=0;i<a.size();i++)
    {
     int cc= static_cast<unsigned char>(a[i]);
      cout<<cc<<endl;
        
    }
0
Диссидент
Эксперт C
 Аватар для Байт
27714 / 17332 / 3810
Регистрация: 24.12.2010
Сообщений: 38,978
17.10.2016, 15:26
Цитата Сообщение от Blitzor DDD Посмотреть сообщение
sss.toLocal8Bit();
Ну и что? Результат повис в воздухе. sss не изменилась.
Попробуй так:
C++ (Qt)
1
2
3
unsigned char aa[20];
strcpy(ss, sss.toLocal8Bit().data());
// и выводи по одной aa[i]
0
14 / 14 / 1
Регистрация: 17.08.2015
Сообщений: 460
17.10.2016, 15:53  [ТС]
Да, вот этот вариант работает как надо
C++ (Qt)
1
2
3
4
5
6
7
8
9
QString sss("aAбБвгд");
 QByteArray a = sss.toLocal8Bit();
 
    for(int i=0;i<a.size();i++)
    {
     int cc= static_cast<unsigned char>(a[i]);
      cout<<cc<<endl;
        
    }
А можно чуть-чуть теории?
Вот здесь QByteArray a = sss.toLocal8Bit(); мы избегаем всякой путанницы с различными кодировками и просто последовательность символов конвертируем в последовательность байтов и дальше с этим уже можно удобно работать?
То есть, QByteArray - это некий универсальный класс для работы с символами, наподобие QVariant?
0
7804 / 6568 / 2988
Регистрация: 14.04.2014
Сообщений: 28,705
17.10.2016, 15:57
Цитата Сообщение от Blitzor DDD Посмотреть сообщение
А можно чуть-чуть теории?
Все нормальные программы используют юникод, но оставлена возможность перекодировать в древний формат. При этом байты сохраняются в QByteArray, это примерно как вектор, только с дополнительными функциями. А само перекодирование зависит от настроек системы -русская Windows будет в 1251 перекодировать.
0
19491 / 10097 / 2460
Регистрация: 30.01.2014
Сообщений: 17,805
18.10.2016, 09:42
Цитата Сообщение от Blitzor DDD Посмотреть сообщение
А можно чуть-чуть теории?
Тут теория простая как 2 копейки.
Нужно понимать в какой кодировке у тебя сохранен сам файл исходника. В этой же кодировке у тебя будут строковые литералы (но не широкие, про них чуть по-другому) в коде. Если у тебя файл в UTF-8 сохранен, то и символы литерала тоже будут в UTF-8.
А дальше открываешь любой источник информации по UTF-8 и видишь, что символы там кодируются несколькими байтами (до 6), а не одним (для русских символов - это будет 2 байта). Т.е. привычной индексации - один char - один символ ты тут в общем случае не получишь.

Цитата Сообщение от Blitzor DDD Посмотреть сообщение
QByteArray - это некий универсальный класс для работы с символами, наподобие QVariant?
QByteArray - это обычная последовательность байт, как массив. Про символы он вообще ничего не знает.

Цитата Сообщение от Blitzor DDD Посмотреть сообщение
Вот здесь QByteArray a = sss.toLocal8Bit(); мы избегаем всякой путанницы с различными кодировками
Вся суть кода выше вот в чем:
* Конструктор QString конвертирует строку, переданную ему в параметре, из UTF-8 в UTF-16. UTF-16 - это внутренее представление символов в QString.
* UTF-16 - можно преобразовать в любую 8-битную кодировку, если в ней есть коды для необходимых символов. В данном случае toLocal8Bit() получает кодировку текущей локали. В твоем случае, на русской Windows, это будет кодировка cp1251.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
18.10.2016, 09:42
Помогаю со студенческими работами здесь

Из русских букв в английские
написал код,который если написать руддщ запишет как Hello я хочу каким то невероятным образом выполнить это...был алгоритм типа этого ...

Ввод русских букв
Не могу понять почему при вводе русских символом программа начинает ругаться. Можно ли как-нибудь решить эту проблему? #include...

Вывод русских букв в консоли
Всем добрый день. Никак не удаётся решить проблему с нормальным выводом русских букв в консоли. Буквы отображаются через всякие другие...

Кодировка русских букв в MacOS
здравствуйте, пишу программу на си под макосью, в качестве компилятора использую Xcode, возникает проблема с кодировкой русских букв. ...

Запись русских букв в массив!
Приветствую Вас друзья! Кто знает как грамотно передать с клавиатуры русские буквы в массив типа char, когда заношу на экране выходит...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
18
Ответ Создать тему
Опции темы

Новые блоги и статьи
Модель микоризы: классовый агентный подход 3
anaschu 06.01.2026
aa0a7f55b50dd51c5ec569d2d10c54f6/ O1rJuneU_ls https:/ / vkvideo. ru/ video-115721503_456239114
Owen Logic: О недопустимости использования связки «аналоговый ПИД» + RegKZR
ФедосеевПавел 06.01.2026
Owen Logic: О недопустимости использования связки «аналоговый ПИД» + RegKZR ВВЕДЕНИЕ Введу сокращения: аналоговый ПИД — ПИД регулятор с управляющим выходом в виде числа в диапазоне от 0% до. . .
Модель микоризы: классовый агентный подход 2
anaschu 06.01.2026
репозиторий https:/ / github. com/ shumilovas/ fungi ветка по-частям. коммит Create переделка под биомассу. txt вход sc, но sm считается внутри мицелия. кстати, обьем тоже должен там считаться. . . .
Расчёт токов в цепи постоянного тока
igorrr37 05.01.2026
/ * Дана цепь постоянного тока с сопротивлениями и напряжениями. Надо найти токи в ветвях. Программа составляет систему уравнений по 1 и 2 законам Кирхгофа и решает её. Последовательность действий:. . .
Новый CodeBlocs. Версия 25.03
palva 04.01.2026
Оказывается, недавно вышла новая версия CodeBlocks за номером 25. 03. Когда-то давно я возился с только что вышедшей тогда версией 20. 03. С тех пор я давно снёс всё с компьютера и забыл. Теперь. . .
Модель микоризы: классовый агентный подход
anaschu 02.01.2026
Раньше это было два гриба и бактерия. Теперь три гриба, растение. И на уровне агентов добавится между грибами или бактериями взаимодействий. До того я пробовал подход через многомерные массивы,. . .
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост.
Programma_Boinc 28.12.2025
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост. Налог на собак: https:/ / **********/ gallery/ V06K53e Финансовый отчет в Excel: https:/ / **********/ gallery/ bKBkQFf Пост отсюда. . .
Кто-нибудь знает, где можно бесплатно получить настольный компьютер или ноутбук? США.
Programma_Boinc 26.12.2025
Нашел на реддите интересную статью под названием Anyone know where to get a free Desktop or Laptop? Ниже её машинный перевод. После долгих разбирательств я наконец-то вернула себе. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru