Форум программистов, компьютерный форум CyberForum.ru

Кодировки в консоли Windows - C++

Восстановить пароль Регистрация
 
Yars2010
 Аватар для Yars2010
1 / 1 / 1
Регистрация: 09.01.2014
Сообщений: 16
04.03.2016, 19:22     Кодировки в консоли Windows #1
Здравствуйте. Хотелось бы узнать, почему при запуске программы в консоли Windows, система отправляет массив argv в функцию main в кодировке cp1251, а при работе через потоки iostream, в кодировке cp866, при том что сама система работает с unicode.

Компилятор mingw, кодировка исходника utf-8 with BOM, флаги -std=c++11 -funsigned-char
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
#include <iostream>
#include <locale>
#include <string>
#include <cstring>
#include <vector>
#include "codecvt_cp866.hpp"
#include "codecvt_cp1251.hpp"
 
using namespace std;
 
int main(int argc, char** argv){
 
    ios_base::sync_with_stdio(false);
    locale loc1251(locale(""), new codecvt_cp1251);
    locale loc866 (locale(""), new codecvt_cp866);
    wcout.imbue(loc866); wcin.imbue(loc866);
 
    if(argc == 1){
        wcout << L"Входные параметры отсутствуют" << endl;
        return 1;
    }
    // Вектор с входными параметрами
    vector<string> argv_cp1251(argv + 1, argv + argc);
 
    wcout << L"Введите слова через пробел: " << flush;
 
    // Вектор с параметрами из потока
    vector<string> cin_cp866;
    char ch;
    do{
        string str;
        while(cin.get(ch)){
            if(ch != '\n' && !isspace(ch))
                str.push_back(ch);
            else
                break;
        }
        cin_cp866.push_back(str);
    }
    while(ch != '\n');
 
 
    wchar_t* pwchar; const char* pchar;
    std::mbstate_t state = std::mbstate_t();
 
    const codecvt_cp1251& facet_1251 = std::use_facet<codecvt_cp1251>(loc1251);
 
    // Вектор с входными параметрами unicode
    vector<wstring> argv_unicode;
    for(size_t i = 0; i < argv_cp1251.size(); i++){
        const char* c_str = argv_cp1251[i].c_str();
        size_t len = argv_cp1251[i].size();
 
        wchar_t* buff = new wchar_t[len];
        facet_1251.in(state, c_str, c_str + len, pchar, buff, buff + len, pwchar);
        wstring str(buff, len);
        delete buff;
 
        argv_unicode.push_back(str);
    }
 
    const codecvt_cp866& facet_cp866 = std::use_facet<codecvt_cp866>(loc866);
 
    // Вектор с параметрами из потока в unicode
    vector<wstring> cin_unicode;
    for(size_t i = 0; i < cin_cp866.size(); i++){
        const char* c_str = cin_cp866[i].c_str();
        size_t len = cin_cp866[i].size();
 
        wchar_t* buff = new wchar_t[len];
        facet_cp866.in(state, c_str, c_str + len, pchar, buff, buff + len, pwchar);
        wstring str(buff, len);
        delete buff;
 
        cin_unicode.push_back(str);
    }
 
    wcout << L"\nВходные параметры (cp1251 -> string -> int): " << endl;
    for(size_t i = 0; i < argv_cp1251.size(); i++){
        string str = argv_cp1251[i]; wstring u_str = argv_unicode[i];
 
        wcout << (i + 1) << L". ";
        for(size_t j = 0; j < str.size(); j++){
            wcout << u_str[j] << L"(" << static_cast<int>(str[j]) << L") ";
        }
        wcout << endl;
    }
    wcout << L"\nСлова из потока (cp866 -> string -> int): " << endl;
    for(size_t i = 0; i < cin_cp866.size(); i++){
        string str = cin_cp866[i]; wstring u_str = cin_unicode[i];
 
        wcout << (i + 1) << L". ";
        for(size_t j = 0; j < str.size(); j++){
            wcout << u_str[j] << L"(" << static_cast<int>(str[j]) << L") ";
        }
        wcout << endl;
    }
 
    wcout << L"\nВходные параметры unicode(cp1251 -> string -> unicode -> wstring -> int): " << endl;
    for(size_t i = 0; i < argv_unicode.size(); i++){
        wstring str = argv_unicode[i];
 
        wcout << (i + 1) << L". ";
        for(size_t j = 0; j < str.size(); j++){
            wcout << str[j] << L"(" << static_cast<int>(str[j]) << L") ";
        }
        wcout << endl;
    }
    wcout << L"\nСлова из потока unicode(cp866 -> string -> unicode -> wstring -> int): " << endl;
    for(size_t i = 0; i < cin_unicode.size(); i++){
        wstring str = cin_unicode[i];
 
        wcout << (i + 1) <<  L". ";
        for(size_t j = 0; j < str.size(); j++){
            wcout << str[j] << L"(" << static_cast<int>(str[j]) << L") ";
        }
        wcout << endl;
    }
 
    return 0;
}
Добавлено через 7 часов 59 минут
Up!
Similar
Эксперт
41792 / 34177 / 6122
Регистрация: 12.04.2006
Сообщений: 57,940
04.03.2016, 19:22     Кодировки в консоли Windows
Посмотрите здесь:

C++ Кодировки в С++
C++ Перевод кодировки
C++ Кодировки
C++ Ошибка кодировки?
C++ Как в консоли под Windows выкинуть исключение диалоговым окном?
После регистрации реклама в сообщениях будет скрыта и будут доступны все возможности форума.
zer0mail
04.03.2016, 19:31
  #2

Не по теме:

Анекдот (старый):
Учитель русского языка в грузинской школе: "Вилька и тарелька пишутся без мягкого знака, а сол и фасол - с мягким. Дэти, это нелзя понять - это надо запомнить!"

zer0mail
04.03.2016, 21:13
  #3

Не по теме:

В приведенном мной анекдоте ключевая мысль: не надо всегда искать логическое объяснение. Иногда проще запомнить (и не греть голову)

Yars2010
 Аватар для Yars2010
1 / 1 / 1
Регистрация: 09.01.2014
Сообщений: 16
17.03.2016, 10:01  [ТС]     Кодировки в консоли Windows #4
Цитата Сообщение от zer0mail Посмотреть сообщение
В приведенном мной анекдоте ключевая мысль: не надо всегда искать логическое объяснение. Иногда проще запомнить (и не греть голову)
Спасибо, но хотелось бы более подробного ответа. Кто может объяснить? С уважением.
vxg
Модератор
 Аватар для vxg
2662 / 1673 / 157
Регистрация: 13.01.2012
Сообщений: 6,224
17.03.2016, 13:05     Кодировки в консоли Windows #5
Консоль работает в оем кодировке. Аргументы шлются в ацп кодирове. Кодировка исходника влияет на то как будут хранится строки. Способность программы работать с юникодом- это просто способность
Yandex
Объявления
17.03.2016, 13:05     Кодировки в консоли Windows
Ответ Создать тему
Опции темы

Текущее время: 04:12. Часовой пояс GMT +3.
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2016, vBulletin Solutions, Inc.
Рейтинг@Mail.ru