Форум программистов, компьютерный форум, киберфорум
С++ для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.67/9: Рейтинг темы: голосов - 9, средняя оценка - 4.67
2784 / 1937 / 570
Регистрация: 05.06.2014
Сообщений: 5,602

Iswalpha не переваривает юникод

25.06.2016, 07:12. Показов 1961. Ответов 11
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Задача - проверить является ли символ частью слова. Под частью слова я подразумеваю символы любых азбук, иероглифы, etc. Короче, все чем слова записываются. Использую iswalpha, подсовываю ему い из хираганы, как часть слова символ не распознается. Ну ладно, может слоговое письмо не считается alphabetic letter? Окей, подсовываю русскую А. Все равно не распознается. Кто виноват и что делать?
C++
1
2
3
4
5
6
#include<cwctype>
#include<iostream>
int main()
{
    std::cout<<(iswalpha(L'い')?"ok":"ops...");
}

Не по теме:

PS Кстати, почему C++ тег то юникодом подавился?

0
Лучшие ответы (1)
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
25.06.2016, 07:12
Ответы с готовыми решениями:

Непонятно почему не переваривает
#include&lt;stdio.h&gt; #include&lt;stdlib.h&gt; #include&lt;math.h&gt; main() {int K,M,N; int input; scanf(&quot;%d\n%d\n%d&quot;,&amp;K,&amp;M,&amp;N); ...

почему Питон не переваривает кирилицу?
я новичок. столкнулся с принеприятнейшим моментом - комментарии в коде нужно отфильтровывать иначе питон просто в ауте, даже нет ругани с...

Юникод в XE
function GetFileList(const Path: String): string; var a: Cardinal; fa: _WIN32_FIND_DATAA; begin result:=''; TRY ...

11
7804 / 6568 / 2988
Регистрация: 14.04.2014
Сообщений: 28,705
25.06.2016, 07:29
А почему там несколько символов в iswalpha()? Локаль русскую установи, чтобы распознавались русские буквы.
0
2784 / 1937 / 570
Регистрация: 05.06.2014
Сообщений: 5,602
25.06.2016, 07:53  [ТС]
Цитата Сообщение от nmcf Посмотреть сообщение
А почему там несколько символов в iswalpha()?
Это не три символа, это три байта соответствующие い в utf-8. Все претензии к движку форума который utf-8 подавился. В копии на Codepad все в порядке, в кавычках один символ.
Цитата Сообщение от nmcf Посмотреть сообщение
Локаль русскую установи, чтобы распознавались русские буквы.
Какой смысл использовать юникод, если опять локали туда-сюда переключать?
0
7804 / 6568 / 2988
Регистрация: 14.04.2014
Сообщений: 28,705
25.06.2016, 08:01
Лучший ответ Сообщение было отмечено Renji как решение

Решение

Цитата Сообщение от Renji Посмотреть сообщение
Это не три символа, это три байта соответствующие い в utf-8.
iswalpha() разве понимает utf-8? Я всегда считал, что там wchar_t нужен.
Цитата Сообщение от Renji Посмотреть сообщение
Какой смысл использовать юникод, если опять локали туда-сюда переключать?
Ну ты сам юникод-то тоже не включил. Надо что-то типа "rus_rus.utf8" или "rus_rus.utf16".
1
2784 / 1937 / 570
Регистрация: 05.06.2014
Сообщений: 5,602
25.06.2016, 08:16  [ТС]
Цитата Сообщение от nmcf Посмотреть сообщение
iswalpha() разве понимает utf-8? Я всегда считал, что там wchar_t нужен.
А разве буква L перед кавычками не указывает что нужно сконвертировать содержимое кавычек в wchar_t?
Цитата Сообщение от nmcf Посмотреть сообщение
Ну ты сам юникод-то тоже не включил. Надо что-то типа "rus_rus.utf8" или "rus_rus.utf16".
Экхм... Включать utf локаль для юникодной функции? Ну ок, добавил std::setlocale(LC_ALL,"en_US.UTF-8");. Не помогает.
C++
1
2
3
4
5
6
7
#include<cwctype>
#include<iostream>
int main()
{
    std::setlocale(LC_ALL,"en_US.UTF-8");
    std::cout<<(iswalpha(L'い')?"ok":"ops...");
}
Добавлено через 5 минут
UPD Еще более простой тест - перебираем все коды символов от 128 до 65536. Ни один не распознается как часть слова.
C++
1
2
3
4
5
6
7
8
#include<cwctype>
#include<iostream>
int main()
{
    for(int i=128;i<65536;++i)
        if(iswalpha(i))
            std::cout<<i<<std::endl;
}
0
7804 / 6568 / 2988
Регистрация: 14.04.2014
Сообщений: 28,705
25.06.2016, 08:40
А ты в какой среде программируешь? У меня в VS 2013 вот это даёт true без локали даже:
C++
1
iswalpha(L'\u3044')
0
2784 / 1937 / 570
Регистрация: 05.06.2014
Сообщений: 5,602
25.06.2016, 08:44  [ТС]
Цитата Сообщение от nmcf Посмотреть сообщение
А ты в чём программируешь? У меня в VS 2013 вот это даёт true без локали даже:
QtCreator с g++ 4.9.2. На Codepad примерно тоже самое - g++ 4.1.2. Если в студии все работает, значит, вероятно, глюк в g++.
0
7804 / 6568 / 2988
Регистрация: 14.04.2014
Сообщений: 28,705
25.06.2016, 08:46
Попробуй символ кодом записать как у меня.
0
2784 / 1937 / 570
Регистрация: 05.06.2014
Сообщений: 5,602
25.06.2016, 10:30  [ТС]
Цитата Сообщение от nmcf Посмотреть сообщение
Попробуй символ кодом записать как у меня.
Попробовал. И у меня, и на Codepad вышло "ops...".
C++
1
2
3
4
5
6
7
#include<cwctype>
#include<iostream>
int main()
{
    std::setlocale(LC_ALL,"en_US.UTF-8");
    std::cout<<(iswalpha(L'\u3044')?"ok":"ops...");
}
Добавлено через 1 час 41 минуту
Хм, попробовал вместо en_US.UTF-8 использовать ru_RU.UTF-8, теперь заработало. Причем, почему-то локаль ru, а заработало для японских символов. Странная логика. Но да, главное, действительно, локаль надо было выставить.
0
7804 / 6568 / 2988
Регистрация: 14.04.2014
Сообщений: 28,705
25.06.2016, 10:32
А с jpn пробовал?
0
2784 / 1937 / 570
Регистрация: 05.06.2014
Сообщений: 5,602
25.06.2016, 10:43  [ТС]
Цитата Сообщение от nmcf Посмотреть сообщение
А с jpn пробовал?
Нет. Просто, полез проверять какие локали установлены, только теперь заметил что установлены только C.UTF-8 и ru_RU.UTF-8. Причем, C.UTF-8 тоже прокатывает. Видимо, по какой-то безумной логике требуется вызвать setlocale с неважно каким аргументом, главное чтоб валидный был. И пинать уже надо разработчиков системы.
0
7804 / 6568 / 2988
Регистрация: 14.04.2014
Сообщений: 28,705
25.06.2016, 11:45
VS ошибку выдаст, если строка неправильная.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
25.06.2016, 11:45
Помогаю со студенческими работами здесь

Юникод
На одной странице 2816 символов. Сколько КБ информации занимает память компьютера, если текст, создан в Unicode?

Юникод в Си++
Здравствуйте. int main(int argc, char *argv) { wstring s1 = L&quot;abracadabra&quot;; cout &lt;&lt; s1.size() &lt;&lt; endl; // 11 ...

Юникод
Даны случайные символы , переводить его в Unicode и в таком виде выводить его на экран и наоборот. {class Chisla{ char arr = new...

Юникод в с++
Есть код с использованием wstring,wchar_t,wcin,wcout в котором открывается файл в кодировке Юникод но почему-то выводит абракадабру. ...

GetClipboardData и юникод
Добрый день форумчане! В наличии след. функция (&quot;ловит&quot; текст что находится в буфере обмена, и отображает его через меседжбокс): ...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
12
Ответ Создать тему
Новые блоги и статьи
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином. Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов. . . .
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
Создание Single Page Application на фреймах
krapotkin 16.11.2025
Статья исключительно для начинающих. Подходы оригинальностью не блещут. В век Веб все очень привыкли к дизайну Single-Page-Application . Быстренько разберем подход "на фреймах". Мы делаем одну. . .
Фото: Daniel Greenwood
kumehtar 13.11.2025
Расскажи мне о Мире, бродяга
kumehtar 12.11.2025
— Расскажи мне о Мире, бродяга, Ты же видел моря и метели. Как сменялись короны и стяги, Как эпохи стрелою летели. - Этот мир — это крылья и горы, Снег и пламя, любовь и тревоги, И бескрайние. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru