Форум программистов, компьютерный форум, киберфорум
С++ для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.78/80: Рейтинг темы: голосов - 80, средняя оценка - 4.78
2 / 2 / 0
Регистрация: 31.01.2009
Сообщений: 12

Посимвольная обработка UTF8 строки

31.01.2009, 16:41. Показов 16871. Ответов 6
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Добрый день.

пишу программу в С++ в Linux Ubuntu, необходимо обрабатывать строку введенную в UTF-8 (русские символы)

Есть следующий участок:

C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
#include <ncurses.h>
#include <unistd.h>
#include <signal.h>
#include <locale.h>
 
//libncursesw5-dev
//g++ -W -Wall -Wextra -pedantic -lncursesw test.cpp
 
void sig(int)
{
}
 
void show_string_in_table(char *string)
{
    while (*string != '\0')
    {
        printw("%c\n",*string);
        string++;
    }
}
 
int main()
{
    //Устанавливаем локаль
    setlocale(LC_ALL, "");
    signal(SIGINT, sig);
 
    char str[255]="qwedas";
 
    initscr();
    show_string_in_table(str);
    getch();
    endwin();
    return 0;
}
Функция выводит строку посимвольно в столбец. Если строка набранна латиницей.
Все хорошо, но такой метод вывода не применим для двухбайтных и более символов, из-за чего киррилица тут не отрабатывает.

Не подскажете как можно реализовать подобную задачу, обрабатывая строку посимвольно ?
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
31.01.2009, 16:41
Ответы с готовыми решениями:

Посимвольная обработка строки
простой пример использования функции WordIndex(s,n).

Посимвольная обработка строк
Помогите пожалуйста с решением этой задачи. Дана строка. Сформировать строку, содержащую все символы данной за исключение символов...

Посимвольная обработка строк
Доброго времени суток всем))) Дано задание.:Дана строка. Сформировать строку, содержащую все символы данной за исклю-чение символов...

6
4866 / 3288 / 468
Регистрация: 10.12.2008
Сообщений: 10,570
31.01.2009, 22:52
Code
1
2
3
#include <stddef.h>
 
wchar_t s[] = L"...";
чтобы в консоли русские буквы работали, перевожу её в cp1251, но обычно она в utf-8
0
2 / 2 / 0
Регистрация: 31.01.2009
Сообщений: 12
01.02.2009, 13:51  [ТС]
можно примерчик привести? так что-то особо не могу понять.
0
4866 / 3288 / 468
Регистрация: 10.12.2008
Сообщений: 10,570
01.02.2009, 21:29
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
 
#include <stdio.h>
#include <locale.h>
#include <stddef.h>
 
/* выводит коды символов unicode */
main()
{
    wchar_t s[10] = L"ᐙᐂᐔ";
    int i;
    
    setlocale(LC_CTYPE, "UTF-8");
    for (i = 0; i < 3; i++)
        printf("%.4x\n", s[i]);
    
    /* wprintf(L"%s\n", s); */
    
    return 0;
}
коды выводятся, а wprintf не сработала у меня
2
2 / 2 / 0
Регистрация: 31.01.2009
Сообщений: 12
02.02.2009, 10:03  [ТС]
все равно что-то не так полчается...

спасибо за пример. Так же воспользуемся примером:
http://publib.boulder.ibm.com/... mst352.htm

C++
1
2
3
4
5
6
7
8
9
10
#include <wchar.h>
#include <locale.h>
#include <stdarg.h>
 
int main()
{
    setlocale(LC_ALL, "UTF-8");
    wprintf(L"%c\n", L'й');
    return 0;
}
й - набрана в utf-8.

компилем, запускаем:
Code
1
2
$ ./a.out
9
почему не работает...

Добавлено через 55 минут 29 секунд
Разобрался

C++
1
2
3
4
5
6
7
8
9
10
11
12
#include <locale.h>
#include <wchar.h>
 
main()
{
    wchar_t s[] = L"Ураа, русский))";
 
    setlocale(LC_CTYPE, "");
    wprintf(L"%ls\n", s);
 
    return 0;
}
нужно использовать опцию l

Все же вопрос открытый - как обратиться к конкретному элементу массива типа wchar_t ?

Добавлено через 14 минут 44 секунды
все, разобрался со всем) спасибо
2
4866 / 3288 / 468
Регистрация: 10.12.2008
Сообщений: 10,570
02.02.2009, 11:02
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
#include <stddef.h>
#include <locale.h>
#include <stdio.h>
 
/* выводит html файл с кириллицей */
main()
{
    setlocale(LC_ALL, "UTF-8");
    wchar_t s[] = L"абвгдеёжзийклмнопрстуфчцчшщъыьэюя";
    int i;
    
    printf("\
<HTML>\n\
    <HEAD>\n\
        <TITLE>test</TITLE>\n\
    </HEAD>\n\
    <BODY>\n");
    for (i = 0; i < 33; i++)
        printf("%8c&#%.4d<BR>\n", ' ',  s[i]);
    printf("\
    </BODY>\n\
</HTML>\n");
    
    return 0;
}
сохранил в html вывод нормально, wprintf не выводит

Добавлено через 5 минут 52 секунды
ага тоже получил вывод
wchar_t - это unsigned long (в X11/Xlib.h), в ncurses.h unsigned short), короче проверять через sizeof(wchar_t);

C++
1
2
3
4
5
6
7
8
9
10
11
#include <locale.h>
#include <stddef.h>
#include <wchar.h>
 
/* выводит символы unicode */
main()
{
    setlocale(LC_CTYPE, "");
    wprintf(L"%lc%lc%lc\n", 0x140C, 0x1401, 0x140D);
    return 0;
}
1
 Аватар для Pingvin001
1 / 1 / 0
Регистрация: 22.03.2014
Сообщений: 142
10.12.2014, 14:25
Так юникод можно использовать и в Dev 5 под Windows.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
10.12.2014, 14:25
Помогаю со студенческими работами здесь

Посимвольная обработка строк
Вообщем обработка строк должна осуществляться посимвольно (без scanf и sscanf). Нужно найти слова перечисленные через пробел и составить из...

Посимвольная обработка строк
Дано слово. Определить, упорядочены ли его буквы по алфавиту. Выделить первую упорядоченную последовательность в новую строку. #include...

Посимвольная обработка текстового файла: распределение всех слов по длине
Вывести в файле распределение всех слов по длине (т.е. сколько в файле слов из одной буквы, из двух и т.д.). За слово считать цепочку...

Работа с текстовым файлом: как посчитать кол-во букв в слове? (посимвольная обработка)
Работа с текстовым файлом: как посчитать кол-во букв в слове? (посимвольная обработка)

Посимвольная обработка строк: определить, какие четные цифры встречаются наименьшее число раз
Дана строка. Определить какие четные цифры встречаются наименьшее число раз Спасибо


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
7
Ответ Создать тему
Новые блоги и статьи
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта Симптом: После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
Access
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином. Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов. . . .
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
Создание Single Page Application на фреймах
krapotkin 16.11.2025
Статья исключительно для начинающих. Подходы оригинальностью не блещут. В век Веб все очень привыкли к дизайну Single-Page-Application . Быстренько разберем подход "на фреймах". Мы делаем одну. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru