Форум программистов, компьютерный форум, киберфорум
С++ для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.78/80: Рейтинг темы: голосов - 80, средняя оценка - 4.78
2 / 2 / 0
Регистрация: 31.01.2009
Сообщений: 12

Посимвольная обработка UTF8 строки

31.01.2009, 16:41. Показов 16947. Ответов 6
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Добрый день.

пишу программу в С++ в Linux Ubuntu, необходимо обрабатывать строку введенную в UTF-8 (русские символы)

Есть следующий участок:

C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
#include <ncurses.h>
#include <unistd.h>
#include <signal.h>
#include <locale.h>
 
//libncursesw5-dev
//g++ -W -Wall -Wextra -pedantic -lncursesw test.cpp
 
void sig(int)
{
}
 
void show_string_in_table(char *string)
{
    while (*string != '\0')
    {
        printw("%c\n",*string);
        string++;
    }
}
 
int main()
{
    //Устанавливаем локаль
    setlocale(LC_ALL, "");
    signal(SIGINT, sig);
 
    char str[255]="qwedas";
 
    initscr();
    show_string_in_table(str);
    getch();
    endwin();
    return 0;
}
Функция выводит строку посимвольно в столбец. Если строка набранна латиницей.
Все хорошо, но такой метод вывода не применим для двухбайтных и более символов, из-за чего киррилица тут не отрабатывает.

Не подскажете как можно реализовать подобную задачу, обрабатывая строку посимвольно ?
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
31.01.2009, 16:41
Ответы с готовыми решениями:

Посимвольная обработка строки
простой пример использования функции WordIndex(s,n).

Посимвольная обработка строк
Помогите пожалуйста с решением этой задачи. Дана строка. Сформировать строку, содержащую все символы данной за исключение символов...

Посимвольная обработка строк
Доброго времени суток всем))) Дано задание.:Дана строка. Сформировать строку, содержащую все символы данной за исклю-чение символов...

6
4866 / 3287 / 468
Регистрация: 10.12.2008
Сообщений: 10,570
31.01.2009, 22:52
Code
1
2
3
#include <stddef.h>
 
wchar_t s[] = L"...";
чтобы в консоли русские буквы работали, перевожу её в cp1251, но обычно она в utf-8
0
2 / 2 / 0
Регистрация: 31.01.2009
Сообщений: 12
01.02.2009, 13:51  [ТС]
можно примерчик привести? так что-то особо не могу понять.
0
4866 / 3287 / 468
Регистрация: 10.12.2008
Сообщений: 10,570
01.02.2009, 21:29
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
 
#include <stdio.h>
#include <locale.h>
#include <stddef.h>
 
/* выводит коды символов unicode */
main()
{
    wchar_t s[10] = L"ᐙᐂᐔ";
    int i;
    
    setlocale(LC_CTYPE, "UTF-8");
    for (i = 0; i < 3; i++)
        printf("%.4x\n", s[i]);
    
    /* wprintf(L"%s\n", s); */
    
    return 0;
}
коды выводятся, а wprintf не сработала у меня
2
2 / 2 / 0
Регистрация: 31.01.2009
Сообщений: 12
02.02.2009, 10:03  [ТС]
все равно что-то не так полчается...

спасибо за пример. Так же воспользуемся примером:
http://publib.boulder.ibm.com/... mst352.htm

C++
1
2
3
4
5
6
7
8
9
10
#include <wchar.h>
#include <locale.h>
#include <stdarg.h>
 
int main()
{
    setlocale(LC_ALL, "UTF-8");
    wprintf(L"%c\n", L'й');
    return 0;
}
й - набрана в utf-8.

компилем, запускаем:
Code
1
2
$ ./a.out
9
почему не работает...

Добавлено через 55 минут 29 секунд
Разобрался

C++
1
2
3
4
5
6
7
8
9
10
11
12
#include <locale.h>
#include <wchar.h>
 
main()
{
    wchar_t s[] = L"Ураа, русский))";
 
    setlocale(LC_CTYPE, "");
    wprintf(L"%ls\n", s);
 
    return 0;
}
нужно использовать опцию l

Все же вопрос открытый - как обратиться к конкретному элементу массива типа wchar_t ?

Добавлено через 14 минут 44 секунды
все, разобрался со всем) спасибо
2
4866 / 3287 / 468
Регистрация: 10.12.2008
Сообщений: 10,570
02.02.2009, 11:02
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
#include <stddef.h>
#include <locale.h>
#include <stdio.h>
 
/* выводит html файл с кириллицей */
main()
{
    setlocale(LC_ALL, "UTF-8");
    wchar_t s[] = L"абвгдеёжзийклмнопрстуфчцчшщъыьэюя";
    int i;
    
    printf("\
<HTML>\n\
    <HEAD>\n\
        <TITLE>test</TITLE>\n\
    </HEAD>\n\
    <BODY>\n");
    for (i = 0; i < 33; i++)
        printf("%8c&#%.4d<BR>\n", ' ',  s[i]);
    printf("\
    </BODY>\n\
</HTML>\n");
    
    return 0;
}
сохранил в html вывод нормально, wprintf не выводит

Добавлено через 5 минут 52 секунды
ага тоже получил вывод
wchar_t - это unsigned long (в X11/Xlib.h), в ncurses.h unsigned short), короче проверять через sizeof(wchar_t);

C++
1
2
3
4
5
6
7
8
9
10
11
#include <locale.h>
#include <stddef.h>
#include <wchar.h>
 
/* выводит символы unicode */
main()
{
    setlocale(LC_CTYPE, "");
    wprintf(L"%lc%lc%lc\n", 0x140C, 0x1401, 0x140D);
    return 0;
}
1
 Аватар для Pingvin001
1 / 1 / 0
Регистрация: 22.03.2014
Сообщений: 142
10.12.2014, 14:25
Так юникод можно использовать и в Dev 5 под Windows.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
10.12.2014, 14:25
Помогаю со студенческими работами здесь

Посимвольная обработка строк
Вообщем обработка строк должна осуществляться посимвольно (без scanf и sscanf). Нужно найти слова перечисленные через пробел и составить из...

Посимвольная обработка строк
Дано слово. Определить, упорядочены ли его буквы по алфавиту. Выделить первую упорядоченную последовательность в новую строку. #include...

Посимвольная обработка текстового файла: распределение всех слов по длине
Вывести в файле распределение всех слов по длине (т.е. сколько в файле слов из одной буквы, из двух и т.д.). За слово считать цепочку...

Работа с текстовым файлом: как посчитать кол-во букв в слове? (посимвольная обработка)
Работа с текстовым файлом: как посчитать кол-во букв в слове? (посимвольная обработка)

Посимвольная обработка строк: определить, какие четные цифры встречаются наименьшее число раз
Дана строка. Определить какие четные цифры встречаются наименьшее число раз Спасибо


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
7
Ответ Создать тему
Новые блоги и статьи
Модель заражения группы наркоманов
alhaos 17.04.2026
Условия задачи сформулированы тут Суть: - Группа наркоманов из 10 человек. - Только один инфицирован ВИЧ. - Колются одной иглой. - Колются раз в день. - Колются последовательно через. . .
Мысли в слух. Про "навсегда".
kumehtar 16.04.2026
Подумалось тут, что наверное очень глупо использовать во всяких своих установках понятие "навсегда". Это очень сильное понятие, и я только начинаю понимать край его смысла, не смотря на то что давно. . .
My Business CRM
MaGz GoLd 16.04.2026
Всем привет, недавно возникла потребность создать CRM, для личных нужд. Собственно программа предоставляет из себя базу данных клиентов, в которой можно фиксировать звонки, стадии сделки, а также. . .
Знаешь почему 90% людей редко бывают счастливыми?
kumehtar 14.04.2026
Потому что они ждут. Ждут выходных, ждут отпуска, ждут удачного момента. . . а удачный момент так и не приходит.
Фиксация колонок в отчете СКД
Maks 14.04.2026
Фиксация колонок в СКД отчета типа Таблица. Задача: зафиксировать три левых колонки в отчете. Процедура ПриКомпоновкеРезультата(ДокументРезультат, ДанныеРасшифровки, СтандартнаяОбработка) / / . . .
Настройки VS Code
Loafer 13.04.2026
{ "cmake. configureOnOpen": false, "diffEditor. ignoreTrimWhitespace": true, "editor. guides. bracketPairs": "active", "extensions. ignoreRecommendations": true, . . .
Оптимизация кода на разграничение прав доступа к элементам формы
Maks 13.04.2026
Алгоритм из решения ниже реализован на нетиповом документе, разработанного в конфигурации КА2. Задачи, как таковой, поставлено не было, проделанное ниже исключительно моя инициатива. Было так:. . .
Контроль заполнения и очистка дат в зависимости от значения перечислений
Maks 12.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "ПланированиеПерсонала", разработанного в конфигурации КА2. Задача: реализовать контроль корректности заполнения дат назначения. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru