С Новым годом! Форум программистов, компьютерный форум, киберфорум
Наши страницы

С++ для начинающих

Войти
Регистрация
Восстановить пароль
 
 
Рейтинг: Рейтинг темы: голосов - 22, средняя оценка - 4.68
i_SamSky
6 / 6 / 0
Регистрация: 13.04.2012
Сообщений: 57
#1

Перевести строку из одной кодировки в другую - C++

13.04.2012, 21:25. Просмотров 3079. Ответов 27
Метки нет (Все метки)

Нужно написать программу, перекодирующую строку в кодировке KOI в строку в кодировке Windows-1251 и обратно.

Прорыскал пол-инета, но ничего интересного не нашел. Помогите, хотя бы распишите алгоритм решения :)

Предполагаемые варианты решения:
1) Считывание из файла в опр. кодировке строки, и дальнейшая "подгонка кусками" под другую кодировку, т.е. все различия между кодировками минимизировать.
2) Использовать специализированные функции, только пока непонятно какие :D
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
Similar
Эксперт
41792 / 34177 / 6122
Регистрация: 12.04.2006
Сообщений: 57,940
13.04.2012, 21:25
Здравствуйте! Я подобрал для вас темы с ответами на вопрос Перевести строку из одной кодировки в другую (C++):

Как перевести файл из одной кодировки в другую? - C++
Можете привести реально работающий пример, или ссылку на подробное руководство по переводу файлов из одной кодировки в другую. Мне...

Написать программу конвертер текстовых файлов с одной кодировки в другую из файла (CP1251, UTF8, KOIR8) - C++
Написать программу конвертер текстовых файлов с одной кодировки в другую из файла (текст кириллица. Помогите написать:)

Перевести число из одной системы счисления в другую - C++
Ребят, помогите, уже неделю бьюсь головой об ноут... Нам дали задачу написать прогу, которая будет переводить число из любой системы...

Класс Time. Не могу перевести на другую строку - C++
// Class Time(with operator. Example4).cpp: определяет точку входа для консольного приложения. // #include "stdafx.h" #include...

Можно ли из букв одной строки составить другую строку? - C++
надо проверить, можно ли из первой строки, что мы вводим с клавиатуры, составить слово (строка2), программа не учитывает пробелы, может кто...

можно ли в с++ вызвать переменную из одной функции в другую т.е. мы переменну задали в одной функции а использовали в другой... и как это реализовать? - C++
можно ли в с++ вызвать переменную из одной функции в другую т.е. мы переменну задали в одной функции а использовали в другой... и как это...

27
i_SamSky
6 / 6 / 0
Регистрация: 13.04.2012
Сообщений: 57
14.04.2012, 23:57  [ТС] #16
Цитата Сообщение от Avazart Посмотреть сообщение
Здесь что -то не то не должно быть отрицательных чисел.
Однако только так это у меня работает. Условие на стандартные положительные десятичные коды никак не реагирует.
0
Avazart
Эксперт С++
7262 / 5434 / 304
Регистрация: 10.12.2010
Сообщений: 24,164
Записей в блоге: 17
15.04.2012, 00:16 #17
Что-то у меня подозрения на то что это не win, а какой нибудь обрезаный юникод или че нить такое, попробуйте заменить
string на wstring.
Не пробовали анализировать коды символов KOI то есть кракозяблы выдавать как int?
И желательно int в hex форме что-бы можно было сравнить с таблицой
1
i_SamSky
6 / 6 / 0
Регистрация: 13.04.2012
Сообщений: 57
15.04.2012, 00:25  [ТС] #18
Цитата Сообщение от Avazart Посмотреть сообщение
...кракозяблы выдавать как int
Если я Вас правильно понял, то пытался. В файл записывалось все как и положено, со 192 позиции шел региональный алфавит, т.е. русский.
Вот так:
C++
1
2
3
4
5
6
7
ofstream KoiCode("KoiCode.txt");
for (int i=128; i<=255; i++)
{
    int trer=i; char test=trer;
    KoiCode << test << trer << " ";
}
KoiCode.close();
А насчет win1251 и ansi, у меня различий нет.
0
Миниатюры
Перевести строку из одной кодировки в другую  
Avazart
Эксперт С++
7262 / 5434 / 304
Регистрация: 10.12.2010
Сообщений: 24,164
Записей в блоге: 17
15.04.2012, 00:34 #19
Я имел ввиду коды Юникода, возможно если их обрезать преобразовав к Аnsi то получатся отрицательные числа, поэтому и советую перейти к wstring
0
i_SamSky
6 / 6 / 0
Регистрация: 13.04.2012
Сообщений: 57
15.04.2012, 11:19  [ТС] #20
Вот написал для теста...
C++
1
2
3
4
5
6
7
8
9
10
ofstream Test("Test.txt");
string str1="АБВГД";
wstring str2(str1.begin(), str1.end()); 
     for (int i = 0; i <= str2.length(); i++)
 {
    Test << int(str2[i]) << " ";
 }
string str3(str2.begin(), str2.end());
Test << endl << str3;
Test.close();
Результат работы:
C++
1
2
65472 65473 65474 65475 65476 0 
юабцд
Только теперь я запутался... Мне теперь надо считывать строку из файла KOI/Win1251, преобразовывать к "Unicode" и дальше работать с юникодом, все преобразования вести с ним?
0
Avazart
Эксперт С++
7262 / 5434 / 304
Регистрация: 10.12.2010
Сообщений: 24,164
Записей в блоге: 17
15.04.2012, 15:15 #21
wstring str1=L"АБВГД"; // Наверное

Попробуйте использовать String KoiToUnicode(const String St) в ссылке которой я приводил
только String замените на wstring
0
i_SamSky
6 / 6 / 0
Регистрация: 13.04.2012
Сообщений: 57
15.04.2012, 21:27  [ТС] #22
Цитата Сообщение от Avazart Посмотреть сообщение
C++
1
Result += String((wchar_t)Koi_UnicodeChars[St[i]-0x00C0]);
А что это значит, не подскажете? И еще, по какому принципу Вы составляли табличку кодов (переменная Koi_UnicodeChars)? Насколько я понял, это просто KOI в двоичном виде. Но что с этими кодами делается?
0
Avazart
Эксперт С++
7262 / 5434 / 304
Регистрация: 10.12.2010
Сообщений: 24,164
Записей в блоге: 17
15.04.2012, 21:50 #23
C++
1
Result += String((wchar_t)Koi_UnicodeChars[St[i]-0x00C0])
Добавить символ из таблицы - массива, номер элемента массива равен положению рассматриваемого символа относительно буквы "ю" по таблице т.е 0x00C0,
(wchar_t) приведение int к "длинному символу"
0
Миниатюры
Перевести строку из одной кодировки в другую  
i_SamSky
6 / 6 / 0
Регистрация: 13.04.2012
Сообщений: 57
16.04.2012, 21:02  [ТС] #24
C++
1
2
3
wstring Result="";
. . . 
Result += wstring((wchar_t)Koi_UnicodeChars[St[i]-0x00C0]);
Уже на этой строке возникает первая ошибка: conversion from 'const char [1]' to non-scalar type 'std::wstring' requested.
Пробовал убрать приравнивание, и полезла следующее: invalid conversion from 'wchar_t' to 'const wchar_t*'.
0
Avazart
Эксперт С++
7262 / 5434 / 304
Регистрация: 10.12.2010
Сообщений: 24,164
Записей в блоге: 17
18.04.2012, 18:13 #25
Я так преобразовал
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
wstring KoiToUnicode(const wstring St)
{
 int Koi_UnicodeChars[] = {
0x044E, 0x0430, 0x0431, 0x0446, 0x0434, 0x0435, 0x0444, 0x0433, 0x0445, 0x0438, 0x0439, 0x043A, 0x043B, 0x043C, 0x043D, 0x043E,
0x043F, 0x044F, 0x0440, 0x0441, 0x0442, 0x0443, 0x0436, 0x0432, 0x044C, 0x044B, 0x0437, 0x0448, 0x044D, 0x0449, 0x0447, 0x044A,
0x042E, 0x0410, 0x0411, 0x0426, 0x0414, 0x0415, 0x0424, 0x0413, 0x0425, 0x0418, 0x0419, 0x041A, 0x041B, 0x041C, 0x041D, 0x041E,
0x041F, 0x042F, 0x0420, 0x0421, 0x0422, 0x0423, 0x0416, 0x0412, 0x042C, 0x042B, 0x0417, 0x0428, 0x042D, 0x0429, 0x0427, 0x042A
 };
 wstring Result=L"";
 for (int i = 1; i <= St.length(); i++)
 {
  if (int(St[i])>= 0x00C0 && int(St[i])<= 0x00FF)
    Result += Koi_UnicodeChars[St[i]-0x00C0];
  else Result += St[i];
 }
 return Result;
}
0
i_SamSky
6 / 6 / 0
Регистрация: 13.04.2012
Сообщений: 57
21.04.2012, 00:49  [ТС] #26
Возникло несколько проблем при обращении к функции из тела программы, и из-за недостатка времени дописал старый вариант программы. Может кому-то понадобится

P.S.: Все криво, коряво, быдлокодяво, но работает
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
#include <iostream>
#include <fstream>
 
using std::string;
using std::ifstream;
using std::ofstream;
using std::endl;
 
string WinToKoi(const string St)
{
    string Result=St;
     for (int i = 0; i <= St.length(); i++)
 {
    //большие
    if (  (int(St[i]) == -64) || (int(St[i]) == -63) || (int(St[i]) == -56) || (int(St[i]) == -55)
       || (int(St[i]) == -54) || (int(St[i]) == -53) || (int(St[i]) == -52) || (int(St[i]) == -51)
       || (int(St[i]) == -50) || (int(St[i]) == -49)
       )
        Result[i] = St[i]+33;
    if ( int(St[i]) == -62) Result[i]=St[i]+53;
    if ( int(St[i]) == -61) Result[i]=St[i]+36;
    if ( int(St[i]) == -60 || int(St[i]) == -59)
        Result[i]=St[i]+32;
    if ( int(St[i]) == -58) Result[i]=St[i]+48;
    if ( int(St[i]) == -57) Result[i]=St[i]+51;
    if ( int(St[i]) == -48 || int(St[i]) == -47 || int(St[i]) == -46 || int(St[i]) == -45)
        Result[i]=St[i]+34;
    if ( int(St[i]) == -44) Result[i]=St[i]+18;
    if ( int(St[i]) == -43) Result[i]=St[i]+19;
    if ( int(St[i]) == -42) Result[i]=St[i]+13;
    if ( int(St[i]) == -41) Result[i]=St[i]+39;
    if ( int(St[i]) == -40) Result[i]=St[i]+35;
    if ( int(St[i]) == -39) Result[i]=St[i]+36;
    if ( int(St[i]) == -38) Result[i]=St[i]+37;
    if ( int(St[i]) == -37 || int(St[i]) == -36)
        Result[i]=St[i]+29;
    if ( int(St[i]) == -35) Result[i]=St[i]+31;
    if ( int(St[i]) == -34) Result[i]=St[i]+2;
    if ( int(St[i]) == -33) Result[i]=St[i]+18;
 
    //маленькие
    if ( int(St[i]) == -32 || int(St[i]) == -31 || int(St[i]) == -24 || int(St[i]) == -23
      || int(St[i]) == -22 || int(St[i]) == -21 || int(St[i]) == -20 || int(St[i]) == -19
      || int(St[i]) == -18 || int(St[i]) == -17)
        Result[i] = St[i]-31;
    if ( int(St[i]) == -30) Result[i]=St[i]-11;
    if ( int(St[i]) == -29) Result[i]=St[i]-28;
    if ( int(St[i]) == -28 || int(St[i]) == -27 ) Result[i]=St[i]-32;
    if ( int(St[i]) == -26) Result[i]=St[i]-16;
    if ( int(St[i]) == -25) Result[i]=St[i]-13;
    if ( int(St[i]) == -16 || int(St[i]) == -15 || int(St[i]) == -14 || int(St[i]) == -13)
        Result[i]=St[i]-30;
    if ( int(St[i]) == -12) Result[i]=St[i]-46;
    if ( int(St[i]) == -11) Result[i]=St[i]-45;
    if ( int(St[i]) == -10) Result[i]=St[i]-51;
    if ( int(St[i]) == -9)  Result[i]=St[i]-25;
    if ( int(St[i]) == -8)  Result[i]=St[i]-29;
    if ( int(St[i]) == -7)  Result[i]=St[i]-28;
    if ( int(St[i]) == -6)  Result[i]=St[i]-27;
    if ( int(St[i]) == -5)  Result[i]=St[i]-34;
    if ( int(St[i]) == -4)  Result[i]=St[i]-36;
    if ( int(St[i]) == -3)  Result[i]=St[i]-33;
    if ( int(St[i]) == -2)  Result[i]=St[i]-62;
    if ( int(St[i]) == -1)  Result[i]=St[i]-46;
 }
    return Result;
}
 
string KoiToWin(const string St)
{
    string Result=St;
     for (int i = 0; i <= St.length(); i++)
 {
    //большие
    if ( int(St[i]) == -32 ) Result[i]=St[i]-2;
    if ( int(St[i]) == -31 ) Result[i]=St[i]-33;
    if ( int(St[i]) == -30 ) Result[i]=St[i]-33;
    if ( int(St[i]) == -29 ) Result[i]=St[i]-13;
    if ( int(St[i]) == -28 || int(St[i]) == -27)
        Result[i]=St[i]-32;
    if ( int(St[i]) == -26 ) Result[i]=St[i]-18; //Ф
    if ( int(St[i]) == -25 ) Result[i]=St[i]-36;
    if ( int(St[i]) == -24 ) Result[i]=St[i]-19;
    if ( int(St[i]) == -23 || int(St[i]) == -22 || int(St[i]) == -21
      || int(St[i]) == -20 || int(St[i]) == -19 || int(St[i]) == -18
      || int(St[i]) == -17 || int(St[i]) == -16)
        Result[i]=St[i]-33;
    if ( int(St[i]) == -15 ) Result[i]=St[i]-18;
    if ( int(St[i]) == -14 || int(St[i]) == -13 || int(St[i]) == -12 || int(St[i]) == -11)
        Result[i]=St[i]-34;
    if ( int(St[i]) == -10 ) Result[i]=St[i]-48;
    if ( int(St[i]) == -9 ) Result[i]=St[i]-53;
    if ( int(St[i]) == -8 ) Result[i]=St[i]-28;
    if ( int(St[i]) == -7 ) Result[i]=St[i]-30;
    if ( int(St[i]) == -6 ) Result[i]=St[i]-51;
    if ( int(St[i]) == -5 ) Result[i]=St[i]-35;
    if ( int(St[i]) == -4 ) Result[i]=St[i]-31;
    if ( int(St[i]) == -3 ) Result[i]=St[i]-36;
    if ( int(St[i]) == -2 ) Result[i]=St[i]-39;
    if ( int(St[i]) == -1 ) Result[i]=St[i]-37;
 
    //маленькие
    if ( int(St[i]) == -64) Result[i]=St[i]+62;
    if ( int(St[i]) == -63 || int(St[i]) == -62 )
        Result[i]=St[i]+31;
    if ( int(St[i]) == -61) Result[i]=St[i]+51;
    if ( int(St[i]) == -60 || int(St[i]) == -59 )
        Result[i]=St[i]+32;
    if ( int(St[i]) == -58) Result[i]=St[i]+46;
    if ( int(St[i]) == -57) Result[i]=St[i]+28;
    if ( int(St[i]) == -56) Result[i]=St[i]+45;
    if ( int(St[i]) == -55 || int(St[i]) == -54 || int(St[i]) == -53 || int(St[i]) == -52
      || int(St[i]) == -51 || int(St[i]) == -50 || int(St[i]) == -49 || int(St[i]) == -48)
        Result[i]=St[i]+31;
    if ( int(St[i]) == -47) Result[i]=St[i]+46;
    if ( int(St[i]) == -46 || int(St[i]) == -45 || int(St[i]) == -44 || int(St[i]) == -43)
        Result[i]=St[i]+30;
    if ( int(St[i]) == -42) Result[i]=St[i]+16;
    if ( int(St[i]) == -41) Result[i]=St[i]+11;
    if ( int(St[i]) == -40) Result[i]=St[i]+36;
    if ( int(St[i]) == -39) Result[i]=St[i]+34;
    if ( int(St[i]) == -38) Result[i]=St[i]+13;
    if ( int(St[i]) == -37) Result[i]=St[i]+29;
    if ( int(St[i]) == -36) Result[i]=St[i]+33;
    if ( int(St[i]) == -35) Result[i]=St[i]+28;
    if ( int(St[i]) == -34) Result[i]=St[i]+25;
    if ( int(St[i]) == -33) Result[i]=St[i]+27;
 }
    return Result;
}
 
int main()
{
 
ifstream inKOI("inputKOI.txt");
string s1;
while (!inKOI.eof())
    {
        if (inKOI.eof()) break;
        inKOI >> s1;
    }
inKOI.close();
 
string s2;
s2=KoiToWin(s1);
 
ofstream KoiWin("KoiToWin.txt");
KoiWin << "s1: " << s1 << endl;
KoiWin << "s2: " << s2 << endl;
KoiWin.close();
 
//---------------------------------------------
 
ifstream inWIN("inputWin1251.txt");
string s3;
while (!inWIN.eof())
    {
        if (inWIN.eof()) break;
        inWIN >>  s3;
    }
inWIN.close();
 
string s4;
s4=WinToKoi(s3);
 
ofstream WinKoi("WinToKoi.txt");
WinKoi << "s1: " << s3 << endl;
WinKoi << "s2: " << s4 << endl;
WinKoi.close();
 
 
 
ofstream WinDa("WinDa.txt");
for (int i=128; i<=255; i++)
{
    int trer=i; char test=trer;
    WinDa << test << trer << " ";
}
WinDa.close();
 
ofstream KoiCode("KoiCode.txt");
for (int i=128; i<=255; i++)
{
    int trer=i; char test=trer;
    KoiCode << test << trer << " ";
}
KoiCode.close();
 
std::cout << "Look in Files ^^" << endl;
 
    return 0;
}
0
Avazart
Эксперт С++
7262 / 5434 / 304
Регистрация: 10.12.2010
Сообщений: 24,164
Записей в блоге: 17
21.04.2012, 00:52 #27
Возникло несколько проблем при обращении к функции из тела программы
А что за проблемы?У меня вроде нормально работало с последним вариантом...
0
i_SamSky
6 / 6 / 0
Регистрация: 13.04.2012
Сообщений: 57
23.04.2012, 16:03  [ТС] #28
Цитата Сообщение от Avazart Посмотреть сообщение
А что за проблемы?
Наподобие этого:
C++
1
const char [1]' to non-scalar type 'std::wstring' requested
Да уже в принципе и не важно, что за проблемы. Преподаватель уже принял программу и оценил ее. Спасибо что помогали мне столь долгое время :)
0
23.04.2012, 16:03
MoreAnswers
Эксперт
37091 / 29110 / 5898
Регистрация: 17.06.2006
Сообщений: 43,301
23.04.2012, 16:03
Привет! Вот еще темы с ответами:

Функция, которая копирует строку в другую строку заданное количество раз - C++
Помогите!!!! срочно нужна задача. Не знаю как сделать. Разработать функцию, которая копирует строку в другую строку заданное количество...

Перевести длинную бинарную строку в строку с десятичными цифрами - C++
Добрый день. Проблема следующая: есть бинарное число 11010111010111111110.......11100011010110110 - необходимо его представить в виде...

Перекодировать строку из кодировки KOI в кодировку Windows-1251 и обратно - C++
Кодировщик. Написать программу, перекодирующую строку в кодировке KOI в строку в кодировке Windows-1251 и обратно. написать...

Перевести L студентов с 1-й группы в другую (списки) - C++
Даны 2 списка, содержащих фамилии студентов 2-х групп. Перевести L студентов с 1-й группы в другую. Число пересчета-К. Для меня списки -...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
28
Ответ Создать тему
Опции темы

КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2017, vBulletin Solutions, Inc.