Форум программистов, компьютерный форум, киберфорум
С++ для начинающих
Войти
Регистрация
Восстановить пароль
Карта форума Темы раздела Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.88/120: Рейтинг темы: голосов - 120, средняя оценка - 4.88
14 / 14 / 1
Регистрация: 17.08.2015
Сообщений: 460
1

Получить ASCII код русских букв

17.10.2016, 14:36. Показов 23010. Ответов 17
Метки нет (Все метки)

Author24 — интернет-сервис помощи студентам
Нужно получить код аски кода русского символа. Казалось бы, ничего сложного, но.
Первая проблема заключается в том, что у меня не очень корректно работает ввод и вывод русских символов в консоли. Когда я ввожу что-нибудь русское в консоль - отображается и выводится нормально, но если я пропишу русские символы в самом коде в строковой переменной, то выводит кракозябры.

Вот код:
C++ (Qt)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
#include <iostream>
#include <Windows.h>
using namespace std;
 
int main(int argc, char* argv[])
{
    SetConsoleCP(1251);// установка кодовой страницы win-cp 1251 в поток ввода
    SetConsoleOutputCP(1251); // установка кодовой страницы win-cp 1251 в поток вывода
 
    char string[20]={"абвгд"};
  //  cin >> string; // вводим строку, используя Кириллицу
    cout << string << endl; // ввывод строки
    cout<<string[3]<<endl;
    for(auto i:string){
        int cc=char(string[i]);
        cout<<cc<<endl;
    }
    return 0;
}
вывод такой:
кракозябры
а потом:
10
32
10
0
10
0
10
0
10
0
-48
-48
-48
-48
-48
-48
-48
-48
-48
-48

А шаг как известно у ascii "абвгд" должен быть единичным. В чем тут дело?
0
Лучшие ответы (1)
Programming
Эксперт
94731 / 64177 / 26122
Регистрация: 12.04.2006
Сообщений: 116,782
17.10.2016, 14:36
Ответы с готовыми решениями:

Номера русских букв в ASCII
Почему такой код setlocale (LC_ALL, &quot;rus&quot; ); cout&lt;&lt;static_cast&lt;char&gt;(231)&lt;&lt;endl;...

Консольный вывод расширенной ASCII и русских букв
Извиняюсь, если подобные темы уже есть, но с помощью поиска получить ответ на свой вопрос я не...

ASCII игра из русских символов
В общем решил написать небольшую консольную игру, все игровые объекты будут отображаться символами...

Из русских букв в английские
написал код,который если написать руддщ запишет как Hello я хочу каким то невероятным образом...

17
13 / 13 / 9
Регистрация: 24.09.2016
Сообщений: 74
17.10.2016, 14:52 2
Насколько знаю, нужно поменять шрифт в консоле.
Выбрать шрифт Lucida Console или Consolas.
0
14 / 14 / 1
Регистрация: 17.08.2015
Сообщений: 460
17.10.2016, 14:53  [ТС] 3
Конечно, я уже поменял на Lucida
0
nd2
3437 / 2816 / 1249
Регистрация: 29.01.2016
Сообщений: 9,426
17.10.2016, 14:55 4
Цитата Сообщение от Blitzor DDD Посмотреть сообщение
Конечно, я уже поменял на Lucida
Среда какая?
0
14 / 14 / 1
Регистрация: 17.08.2015
Сообщений: 460
17.10.2016, 14:56  [ТС] 5
Qt Creator
0
7791 / 6558 / 2984
Регистрация: 14.04.2014
Сообщений: 28,667
17.10.2016, 14:57 6
Надо приводить к беззнаковому char:
C++
1
int cc = static_cast<unsigned char>(string[i]);
А в Qt юникод используется. Там QString надо перекодировать - toLocal8Bit().
0
Диссидент
Эксперт C
27706 / 17322 / 3812
Регистрация: 24.12.2010
Сообщений: 38,979
17.10.2016, 14:58 7
C++
1
2
3
4
for(int i=0; string[i]; i++) {
  int cc = (unsigned char) string[i];
  cout << cc << endl;
}
0
nd2
3437 / 2816 / 1249
Регистрация: 29.01.2016
Сообщений: 9,426
17.10.2016, 14:58 8
Цитата Сообщение от Blitzor DDD Посмотреть сообщение
C++
1
2
3
4
for(auto i:string){
int cc=char(string[i]);
cout<<cc<<endl;
}
Ты что здесь, собственно, делаешь?
0
Диссидент
Эксперт C
27706 / 17322 / 3812
Регистрация: 24.12.2010
Сообщений: 38,979
17.10.2016, 15:00 9
Можно сразу
C++
1
unsigned char string[20]={"абвгд"};
0
14 / 14 / 1
Регистрация: 17.08.2015
Сообщений: 460
17.10.2016, 15:03  [ТС] 10
Теперь код такой:
C++ (Qt)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
#include <iostream>
#include <Windows.h>
using namespace std;
 
int main(int argc, char* argv[])
{
    SetConsoleCP(1251);// установка кодовой страницы win-cp 1251 в поток ввода
    SetConsoleOutputCP(1251); // установка кодовой страницы win-cp 1251 в поток вывода
 
    unsigned char string[20]={"абвгд"};
  //  cin >> string; // вводим строку, используя Кириллицу
    cout << string << endl; // ввывод строки
    cout<<string[3]<<endl;
    for(int i=0; string[i]; i++) {
      int cc = (unsigned char) string[i];
      cout << cc << endl;
    }
    return 0;
}
но вывод все равно неправильный:
кракозябры
208
176
208
177
208
178
208
179
208
180
откуда здесь 208?
0
7791 / 6558 / 2984
Регистрация: 14.04.2014
Сообщений: 28,667
17.10.2016, 15:07 11
Я же тебе сказал: в Qt юникод, а ты мыслишь древними понятиями. Твоя строка будет в utf-8. Используй QString и перекодируй, как я написал выше.
0
Диссидент
Эксперт C
27706 / 17322 / 3812
Регистрация: 24.12.2010
Сообщений: 38,979
17.10.2016, 15:10 12
Блин, в Куте ведь UTF-16.
Тогда уж как-то через toLocal8bit и аналоги. С деталями разбирайся сам. Или жди, когда подвалит кто-то в этом деле покомпетентнее...
0
14 / 14 / 1
Регистрация: 17.08.2015
Сообщений: 460
17.10.2016, 15:18  [ТС] 13
C++ (Qt)
1
2
3
4
5
6
7
 QString sss("aAбБвгд");
    sss.toLocal8Bit();
    for(int i=0;i<sss.length();i++){
     int cc= (unsigned char) sss[i];
      cout<<cc<<endl;
        
    }
Цитата Сообщение от nmcf Посмотреть сообщение
Твоя строка будет в utf-8. Используй QString и перекодируй
Цитата Сообщение от Байт Посмотреть сообщение
Тогда уж как-то через toLocal8bit и аналоги.
так тоже не получается что-то.

Не понимаю я тонкостей тут. toStdString, toStdU1String, toLocal16Bit() и пр.
Разные варианты пробовать вместо sss.toLocal8Bit();?
0
7791 / 6558 / 2984
Регистрация: 14.04.2014
Сообщений: 28,667
17.10.2016, 15:23 14
Лучший ответ Сообщение было отмечено Blitzor DDD как решение

Решение

C++ (Qt)
1
2
3
4
5
6
7
8
9
 QString sss("aAбБвгд");
 QByteArray a = sss.toLocal8Bit();
 
    for(int i=0;i<a.size();i++)
    {
     int cc= static_cast<unsigned char>(a[i]);
      cout<<cc<<endl;
        
    }
0
Диссидент
Эксперт C
27706 / 17322 / 3812
Регистрация: 24.12.2010
Сообщений: 38,979
17.10.2016, 15:26 15
Цитата Сообщение от Blitzor DDD Посмотреть сообщение
sss.toLocal8Bit();
Ну и что? Результат повис в воздухе. sss не изменилась.
Попробуй так:
C++ (Qt)
1
2
3
unsigned char aa[20];
strcpy(ss, sss.toLocal8Bit().data());
// и выводи по одной aa[i]
0
14 / 14 / 1
Регистрация: 17.08.2015
Сообщений: 460
17.10.2016, 15:53  [ТС] 16
Да, вот этот вариант работает как надо
C++ (Qt)
1
2
3
4
5
6
7
8
9
QString sss("aAбБвгд");
 QByteArray a = sss.toLocal8Bit();
 
    for(int i=0;i<a.size();i++)
    {
     int cc= static_cast<unsigned char>(a[i]);
      cout<<cc<<endl;
        
    }
А можно чуть-чуть теории?
Вот здесь QByteArray a = sss.toLocal8Bit(); мы избегаем всякой путанницы с различными кодировками и просто последовательность символов конвертируем в последовательность байтов и дальше с этим уже можно удобно работать?
То есть, QByteArray - это некий универсальный класс для работы с символами, наподобие QVariant?
0
7791 / 6558 / 2984
Регистрация: 14.04.2014
Сообщений: 28,667
17.10.2016, 15:57 17
Цитата Сообщение от Blitzor DDD Посмотреть сообщение
А можно чуть-чуть теории?
Все нормальные программы используют юникод, но оставлена возможность перекодировать в древний формат. При этом байты сохраняются в QByteArray, это примерно как вектор, только с дополнительными функциями. А само перекодирование зависит от настроек системы -русская Windows будет в 1251 перекодировать.
0
18840 / 9839 / 2408
Регистрация: 30.01.2014
Сообщений: 17,280
18.10.2016, 09:42 18
Цитата Сообщение от Blitzor DDD Посмотреть сообщение
А можно чуть-чуть теории?
Тут теория простая как 2 копейки.
Нужно понимать в какой кодировке у тебя сохранен сам файл исходника. В этой же кодировке у тебя будут строковые литералы (но не широкие, про них чуть по-другому) в коде. Если у тебя файл в UTF-8 сохранен, то и символы литерала тоже будут в UTF-8.
А дальше открываешь любой источник информации по UTF-8 и видишь, что символы там кодируются несколькими байтами (до 6), а не одним (для русских символов - это будет 2 байта). Т.е. привычной индексации - один char - один символ ты тут в общем случае не получишь.

Цитата Сообщение от Blitzor DDD Посмотреть сообщение
QByteArray - это некий универсальный класс для работы с символами, наподобие QVariant?
QByteArray - это обычная последовательность байт, как массив. Про символы он вообще ничего не знает.

Цитата Сообщение от Blitzor DDD Посмотреть сообщение
Вот здесь QByteArray a = sss.toLocal8Bit(); мы избегаем всякой путанницы с различными кодировками
Вся суть кода выше вот в чем:
* Конструктор QString конвертирует строку, переданную ему в параметре, из UTF-8 в UTF-16. UTF-16 - это внутренее представление символов в QString.
* UTF-16 - можно преобразовать в любую 8-битную кодировку, если в ней есть коды для необходимых символов. В данном случае toLocal8Bit() получает кодировку текущей локали. В твоем случае, на русской Windows, это будет кодировка cp1251.
0
18.10.2016, 09:42
IT_Exp
Эксперт
87844 / 49110 / 22898
Регистрация: 17.06.2006
Сообщений: 92,604
18.10.2016, 09:42
Помогаю со студенческими работами здесь

Ввод русских букв
Не могу понять почему при вводе русских символом программа начинает ругаться. Можно ли как-нибудь...

Вывод русских букв в консоли
Всем добрый день. Никак не удаётся решить проблему с нормальным выводом русских букв в консоли....

Кодировка русских букв в MacOS
здравствуйте, пишу программу на си под макосью, в качестве компилятора использую Xcode, возникает...

Запись русских букв в массив!
Приветствую Вас друзья! Кто знает как грамотно передать с клавиатуры русские буквы в массив типа...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
18
Ответ Создать тему
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2024, CyberForum.ru