Форум программистов, компьютерный форум, киберфорум
С++ для начинающих
Войти
Регистрация
Восстановить пароль
Карта форума Темы раздела Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.60/15: Рейтинг темы: голосов - 15, средняя оценка - 4.60
979 / 196 / 33
Регистрация: 26.09.2012
Сообщений: 2,041
1

Текст в кодировке cp1251 перевести в utf8 и обратно?

29.01.2015, 12:18. Показов 3018. Ответов 2
Метки нет (Все метки)

Author24 — интернет-сервис помощи студентам
Здорова!
Вот есть код:
Кликните здесь для просмотра всего текста
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
#include <iostream>
using std::cout;
using std::endl;
using std::cerr;
using std::cin;
#include <string>
using std::string;
#include <fstream>
using std::ifstream;
#include <Windows.h>
 
string Utf8_to_cp1251(const char *str);
string cp1251_to_Utf8(const char *str);
 
 
int main()
{
    setlocale(LC_ALL, "Russian");
 
    string s;
    ifstream ifs("data.html",ifstream::in);
    if(!ifs){cerr <<"don't open file"<<endl;exit(1);}
    string s1;
    while(getline(ifs,s1))
        s+=s1;
    
    cout <<s<<endl<<endl<<endl;//нормально выводит
    //переводим в utf8
    s=cp1251_to_Utf8(s.c_str());
    cout <<s<<endl<<endl<<endl;//крякозябры
 
    //переводим обратно (ниче не получается)
    s=Utf8_to_cp1251(s.c_str());
    cout <<s<<endl<<endl<<endl;//обратно не получается перевести
 
    return 0;
}
 
//функция перевода из cp1251 в Utf8
string cp1251_to_Utf8(const char *str)
{
    string res;
    int result_u, result_c;
  
    result_u = MultiByteToWideChar(CP_UTF8,
        0,
        str,
        -1,
        0,
        0);
  
    if (!result_u)
        return 0;
  
    wchar_t *ures = new wchar_t[result_u];
  
    if(!MultiByteToWideChar(CP_UTF8,
        0,
        str,
        -1,
        ures,
        result_u))
    {
        delete[] ures;
        return 0;
    }
  
    result_c = WideCharToMultiByte(
        CP_UTF8,
        0,
        ures,
        -1,
        0,
        0,
        0, 0);
  
    if(!result_c)
    {
        delete [] ures;
        return 0;
    }
  
    char *cres = new char[result_c];
  
    if(!WideCharToMultiByte(
        CP_UTF8,
        0,
        ures,
        -1,
        cres,
        result_c,
        0, 0))
    {
        delete[] cres;
        return 0;
    }
    delete[] ures;
    res.append(cres);
    delete[] cres;
    return res;
}
 
string Utf8_to_cp1251(const char *str)
{
    string res;
    int result_u, result_c;
 
    result_u = MultiByteToWideChar(CP_UTF8,
        0,
        str,
        -1,
        0,
        0);
 
    if (!result_u)
        return 0;
 
    wchar_t *ures = new wchar_t[result_u];
 
    if(!MultiByteToWideChar(CP_UTF8,
        0,
        str,
        -1,
        ures,
        result_u))
    {
        delete[] ures;
        return 0;
    }
 
    result_c = WideCharToMultiByte(
        1251,
        0,
        ures,
        -1,
        0,
        0,
        0, 0);
 
    if(!result_c)
    {
        delete [] ures;
        return 0;
    }
 
    char *cres = new char[result_c];
 
    if(!WideCharToMultiByte(
        1251,
        0,
        ures,
        -1,
        cres,
        result_c,
        0, 0))
    {
        delete[] cres;
        return 0;
    }
    delete[] ures;
    res.append(cres);
    delete[] cres;
    return res;
}

и текстовый файл в кодировке cp1251 data.zip
Читаю этот текстовый файл, и вывожу текст в сp1251 - выводит нормально
Перевожу его в utf8 вывожу - выводит крякозябры
Перевожу снова его обратно в cp1251 и вывожу, и фигня выводится, а по идее должно вывестись то что и было сразу до кодировки?
0
Programming
Эксперт
94731 / 64177 / 26122
Регистрация: 12.04.2006
Сообщений: 116,782
29.01.2015, 12:18
Ответы с готовыми решениями:

Прочитать файл в кодировке cp1251 и перевести в кодировки koi8r, iso88595, unicode, microsoft sp866
работа с кодовыми таблицами русского языка дан исходный текст , кодировка cp-1251 составить...

Перевести обычный русский текст в utf8
нужно обычный русский текст перевести в такую кодировку: &quot;Почта&quot; раскодировать можно функцией...

из utf8 в cp1251
Всем привет ! Собственно сразу вопрос - как троку перекодировать из utf8 в cp1251 и обратно ? ...

Как перевести руский текст из UTF8 в ANSI
Подскажите как перевести руский текст из UTF8 в ANSI? Заранее спасибо.

2
7796 / 6562 / 2985
Регистрация: 14.04.2014
Сообщений: 28,699
29.01.2015, 14:10 2
В 45-й и 57-й строках должно быть CP_ACP. И в древней консоли без дополнительных настроек ты корректный текст utf-8 не увидишь.
1
979 / 196 / 33
Регистрация: 26.09.2012
Сообщений: 2,041
30.01.2015, 19:42  [ТС] 3
Исправил!
0
30.01.2015, 19:42
IT_Exp
Эксперт
87844 / 49110 / 22898
Регистрация: 17.06.2006
Сообщений: 92,604
30.01.2015, 19:42
Помогаю со студенческими работами здесь

преобразования utf8 <-> cp1251
Какими функциями лучше всего воспользоваться для преобразований utf8 в cp1251 и обратно ?

Перевод из cp1251 в utf8
Как перевести программно на C# это: %CA%D0%C8% в читабельный текст?

Перекодировка строки из cp1251 в UTF8
Доброго времени суток. У меня есть строка в cp1251, но мне нужно вывести в utf8. Как это лучше...

Перекодировка строки cp1251 в utf8
Здравствуйте! Помогите советом, плз. Нужно получить заголовок страницы, и, если кодировка страницы...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
3
Ответ Создать тему
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2024, CyberForum.ru