Форум программистов, компьютерный форум, киберфорум
C/С++ под Linux
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 5.00/26: Рейтинг темы: голосов - 26, средняя оценка - 5.00
0 / 0 / 1
Регистрация: 12.11.2017
Сообщений: 28

Некорректное заполнение char массива кириллицей

02.10.2019, 21:03. Показов 5381. Ответов 14
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Когда заполняю char массив кириллицей и вывожу его, то вместо символов выводятся знаки вопросов. Сначала думал что проблема в кодировке терминала, но cout спокойно выводит кириллицу и стоит стандартный UTF 8. В чем может быть проблема?
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
02.10.2019, 21:03
Ответы с готовыми решениями:

Некорректное заполнение массива
Околосапёр. Не могу понять, почему не работает. Девятка - бомба. Почему-то не хочет окружать её единичками, пропускает предыдущую...

Некорректное заполнение двумерного массива
Доброго дня форумчане! Столкнулся с такой проблемой - заполняю двумерный массив "горизонтально" через кнопку (для примера) по...

Заполнение массива char
Подскажите пожалуйста почему массив char по умолчанию всегда заполняется буквами 'a'? import java.util.Scanner; class A{ public...

14
 Аватар для peter_irich
362 / 216 / 53
Регистрация: 18.10.2017
Сообщений: 2,337
02.10.2019, 21:36
Лучший ответ Сообщение было отмечено zik_rey как решение

Решение

Для этого есть тип wchar, но я им никогда не пользуюсь и не умею этого делать.
Для работы с ним есть специальные функции, например, mbtowc(). Ищите, как работать с wchar в Linux, если уж надо.
1
 Аватар для COKPOWEHEU
4078 / 2676 / 432
Регистрация: 09.09.2017
Сообщений: 11,884
02.10.2019, 23:06
Лучший ответ Сообщение было отмечено zik_rey как решение

Решение

zik_rey, код-то покажите, как выводите.
Кто его знает, вдруг вы по одному char'у за раз выводите. Если так, разочарую: в юникоде символ кодируется переменным числом байтов от 1 до 4. Соответственно, один отдельный байт может не значить ничего.
Либо надо использовать широкие строки (wchar [] ), либо работать с обычными как с юникодными, то есть грамотно и аккуратно делить на символы.
1
0 / 0 / 1
Регистрация: 12.11.2017
Сообщений: 28
03.10.2019, 11:21  [ТС]
Вот сам вывод
C++
1
2
3
4
5
6
7
 for(int i = 0; i < 10; i++)
 {
  cout << i << ". ";
  for(int j = 0; j < 8; j++)
   cout << crossword[i][j] << " ";
 cout << "\n";
}
0
 Аватар для COKPOWEHEU
4078 / 2676 / 432
Регистрация: 09.09.2017
Сообщений: 11,884
03.10.2019, 13:51
Лучший ответ Сообщение было отмечено zik_rey как решение

Решение

Цитата Сообщение от zik_rey Посмотреть сообщение
Вот сам вывод
И что это за огрызок? По нему можно разве что сказать, что форматирование кода у вас присутствует.
Где объявление переменных, где ввод, где все?
.
Если же поиграть в телепата и предположить, что crossword это массив массивов символов (массив строк, возможно), то вывод действительно идет по одному char'у, то есть по кусочку символа.
Например, русская буква 'А' имеет код 0xD090, буква 'Б' 0xD091. Вы же выводите сначала 0xD0 (поскольку консоль понимает, что это кусок юникода, он приводится к 0xD000 или чему-то подобному), а потом 0x90.
0
Почетный модератор
7393 / 2639 / 281
Регистрация: 29.07.2006
Сообщений: 13,696
03.10.2019, 14:39
Цитата Сообщение от zik_rey Посмотреть сообщение
crossword[i][j]
zik_rey, буфер char прекрасно справится с хранением вводм-выводом utf8. Показывай как заполняешь и откуда берешь данные. Какая кодировка сорца.
0
 Аватар для COKPOWEHEU
4078 / 2676 / 432
Регистрация: 09.09.2017
Сообщений: 11,884
03.10.2019, 15:04
Пример кода с ошибкой, на которую, возможно, наступил ТС. Кода-то его мы так и не видели...
Code
1
2
3
4
5
6
7
8
9
10
11
12
13
$ cat main.c
#include <stdio.h>
 
int main(){
  char str[100] = "Текст";
  printf("%s\n", str); //вывод как строка
  for(char *ch=str; ch[0]!='\0'; ch++)pritf("%c ", ch[0]); //вывод как отдельные символы
  putchar('\n');
}
$ gcc main.c
$ ./a.out 
Текст
� � � � � � � � � �
0
 Аватар для peter_irich
362 / 216 / 53
Регистрация: 18.10.2017
Сообщений: 2,337
03.10.2019, 21:40
Можно и с char, лишь бы его правильно заполнить. Например, если объявить
C
1
char ctxt[32] = "абвгд";
то
C
1
fprintf(stdout, "%s\n", ctxt);
его выведет, т.е. весь текст как целое, а не посимвольно.
0
 Аватар для COKPOWEHEU
4078 / 2676 / 432
Регистрация: 09.09.2017
Сообщений: 11,884
04.10.2019, 08:00
peter_irich, вы бы мой код посмотрели сначала, нормальный вывод юникода там тоже демонстрируется. Более того, если не добавлять после printf("%c") пробел, он тоже выводится нормально.
0
0 / 0 / 1
Регистрация: 12.11.2017
Сообщений: 28
06.10.2019, 22:11  [ТС]
Создаю и заполняю массив минусами
C++
1
2
3
4
5
6
7
    char crossword[10][9];
    for (int i = 0; i < 10; i++)
    {
        for (int j = 0; j < 8; j++)
            crossword[i][j] = '-';
        crossword[i][8] = '\0';
    }
.
.
.
Если ответ правильный, заполняю строку кириллицей
C++
1
2
3
4
5
6
7
8
9
10
11
12
cin >> answ;
if (answ == "Ефрейтор" || answ == "ефрейтор") {
    crossword[0][0] = 'Е';
    crossword[0][1] = 'Ф';
    crossword[0][2] = 'Р';
    crossword[0][3] = 'Е';
    crossword[0][4] = 'Й';
    crossword[0][5] = 'Т';
    crossword[0][6] = 'О';
    crossword[0][7] = 'Р';
    rightAn = rightAn + 1;
    }
.
.
.
Вывожу массив и получаю ? на выходе
C++
1
2
3
4
5
6
7
for (int i = 0; i < 10; i++)
{
    cout << i << ". ";
    for (int j = 0; j < 8; j++)
    cout << crossword[i][j] << " ";
    cout << "\n";
}
0
Почетный модератор
7393 / 2639 / 281
Регистрация: 29.07.2006
Сообщений: 13,696
06.10.2019, 22:24
Лучший ответ Сообщение было отмечено zik_rey как решение

Решение

Цитата Сообщение от zik_rey Посмотреть сообщение
crossword[0][0] = 'Е';
Это неправильно. Символ 'E' занимает памяти больше, чем один char. Отсюда проблемы. Даже компилятор тебе предупреждение должен выдавать на всех этих строчках.
0
 Аватар для COKPOWEHEU
4078 / 2676 / 432
Регистрация: 09.09.2017
Сообщений: 11,884
07.10.2019, 10:18
Цитата Сообщение от zik_rey Посмотреть сообщение
answ == "Ефрейтор"
Какой тип данных у answ? Просто если строковый, то сравнение '==' не сработает. Оно проверит равенство указателей, а не самих строк. И указатели совершенно точно будут разными. Для сравнения обычных строк предназначены функции strcmp, strncmp. А если надо сравнить регистро-независимо, то strcasecmp, strncasecmp, правда эти реализованы не везде. Впрочем, пройтись по строке и привести все к строчным (или заглавным) никто не мешает.
Цитата Сообщение от zik_rey Посмотреть сообщение
crossword[0][0] = 'Е';
Код буквы 'E' равен 0xD095. При присвоении 8-битному char'у останется только 0x95.
0
0 / 0 / 1
Регистрация: 12.11.2017
Сообщений: 28
07.10.2019, 10:46  [ТС]
Не знаю почему, но у answ тип string, и условие всегда выполняется как задумано.
0
Почетный модератор
7393 / 2639 / 281
Регистрация: 29.07.2006
Сообщений: 13,696
07.10.2019, 10:59
Потому что он вводится не посимвольно. И все код-пойнты помещаются в строку.
0
 Аватар для COKPOWEHEU
4078 / 2676 / 432
Регистрация: 09.09.2017
Сообщений: 11,884
07.10.2019, 11:19
Цитата Сообщение от zik_rey Посмотреть сообщение
Не знаю почему, но у answ тип string, и условие всегда выполняется как задумано.
В смысле std::string, а не обычный char* - вы это хотите сказать? Тогда да, перегруженный оператор сравнения там есть. Но если бы вы привели код, вопросов бы и не возникало.
Ошибка присвоения многобайтного значения однобайтному полю все еще в силе.
Кстати, если используете std::string, что мешало использовать std::wstring?
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
07.10.2019, 11:19
Помогаю со студенческими работами здесь

Заполнение трехмерного динамического массива типа Char
вот само задание : Создать набор функций, позволяющих работать со школьным расписанием. Предположим, что школьник учится 5 дней в неделю...

Заполнение двумерного массива char-ов одним символом
Нужно чтобы весь массив был забит одним символом (например Н) Код: #include &lt;iostream&gt; using namespace std; void main(){ ...

Заполнение двухмерного массива типа char символами цифр
Приветствую всех! Разбираю одну задачу, в которой двухмерный символьный массив заполняется цифрами, представленными в качестве символов....

Строка с кириллицей. Ошибка: invalid multibyte char (US-ASCII)
начал изучать руби . вообще я уже знаю немного из этого и других языков , но когда решил всерьёз заняться этим языком и обновил его версию...

char -> int некорректное представление
Как победить следующую ситуацию? char h='й'; // или char h=137; int h1=h; printf(&quot;%i&quot;, h1); // результат --&gt; -23 ...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
15
Ответ Создать тему
Новые блоги и статьи
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином. Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов. . . .
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
Создание Single Page Application на фреймах
krapotkin 16.11.2025
Статья исключительно для начинающих. Подходы оригинальностью не блещут. В век Веб все очень привыкли к дизайну Single-Page-Application . Быстренько разберем подход "на фреймах". Мы делаем одну. . .
Фото: Daniel Greenwood
kumehtar 13.11.2025
Расскажи мне о Мире, бродяга
kumehtar 12.11.2025
— Расскажи мне о Мире, бродяга, Ты же видел моря и метели. Как сменялись короны и стяги, Как эпохи стрелою летели. - Этот мир — это крылья и горы, Снег и пламя, любовь и тревоги, И бескрайние. . .
PowerShell Snippets
iNNOKENTIY21 11.11.2025
Модуль PowerShell 5. 1+ : Snippets. psm1 У меня модуль расположен в пользовательской папке модулей, по умолчанию: \Documents\WindowsPowerShell\Modules\Snippets\ А в самом низу файла-профиля. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru