Форум программистов, компьютерный форум, киберфорум
С++ для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 5.00/11: Рейтинг темы: голосов - 11, средняя оценка - 5.00
 Аватар для DiffEreD
1458 / 795 / 257
Регистрация: 21.06.2011
Сообщений: 1,740
Записей в блоге: 2

Как правильно можно узнать количество хранимых в строке символов?

04.08.2014, 13:39. Показов 2513. Ответов 13
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Есть строка с юникод символами. Как правильно можно узнать количество хранимых в строке символов?
C++
1
2
3
4
5
6
7
8
9
int main()
{
   std::wifstream wifs("file.txt");
   std::wstring wstr;
   wifs >> wstr; // 5 юникод символов
   std::cout << "Size: " << wstr.size() << "\n"; //выводит 15
 
   return 0;
}
0
Лучшие ответы (1)
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
04.08.2014, 13:39
Ответы с готовыми решениями:

Как узнать о наличии определенных символов в строке и их количество
Есть последовательности типа &quot;1,5,4,7,8,9,6,35,5&quot; или &quot;4567&quot; или &quot;45-56-78-45&quot; Нужно одной строчкой узнать есть ли там...

Как узнать количество символов в строке, с русскоязычными символами?
Всем доброго времени суток, сложилась такая ситуация, в поле input вводится текст, его длина должна быть от 10 до 70 символов, решил...

Как правильно посчитать количество символов в строке после чтения файла антивордом?
Добрый день. Суть задачи: сосчитать количество символов в файле .doc Перепробовал кучу методов, каждый был в чем-то плох. Где-то...

13
Эксперт С++
4986 / 3093 / 456
Регистрация: 10.11.2010
Сообщений: 11,170
Записей в блоге: 10
04.08.2014, 14:09
wstr.length() должна возвращать длину в символах, как и wstr.size().
0
 Аватар для DiffEreD
1458 / 795 / 257
Регистрация: 21.06.2011
Сообщений: 1,740
Записей в блоге: 2
04.08.2014, 15:58  [ТС]
Нет, выводит то же что и size().

Добавлено через 3 минуты
В строке находятся примерно такие каракули: ᴔᴕᴗᴭᴣ

Добавлено через 1 час 42 минуты
Разве что такие грабли писать:
C++
1
2
3
4
5
6
size_t utf8len(const wchar_t *s)
{
    size_t len = 0;
    for (; *s; ++s) if ((*s & 0xC0) != 0x80) ++len;
    return len;
}
0
 Аватар для CyberSolver
102 / 75 / 17
Регистрация: 23.07.2014
Сообщений: 877
Записей в блоге: 1
04.08.2014, 16:05
DiffEreD, входной файл прикрепить можете?
0
 Аватар для DiffEreD
1458 / 795 / 257
Регистрация: 21.06.2011
Сообщений: 1,740
Записей в блоге: 2
04.08.2014, 16:07  [ТС]
Да пожалуйста:
Вложения
Тип файла: txt file.txt (15 байт, 13 просмотров)
0
 Аватар для CyberSolver
102 / 75 / 17
Регистрация: 23.07.2014
Сообщений: 877
Записей в блоге: 1
04.08.2014, 16:22
DiffEreD, сообщение компилятора:
terminate called after throwing an instance of 'std::ios_base::failure'
what(): basic_filebuf::underflow invalid byte sequence in file

Может дело в кодировке входного файла? Сохранил как UTF-16 - выдал 10. Может у вас там utf-8?
0
 Аватар для DiffEreD
1458 / 795 / 257
Регистрация: 21.06.2011
Сообщений: 1,740
Записей в блоге: 2
04.08.2014, 16:29  [ТС]
У меня там UTF-8
0
 Аватар для CyberSolver
102 / 75 / 17
Регистрация: 23.07.2014
Сообщений: 877
Записей в блоге: 1
04.08.2014, 16:46
DiffEreD, тогда просто читайте как string. Потому что wstring - это по 2 байта.
0
 Аватар для DiffEreD
1458 / 795 / 257
Регистрация: 21.06.2011
Сообщений: 1,740
Записей в блоге: 2
04.08.2014, 16:58  [ТС]
Это сути не меняет. size() все равно не выведет количество символов. Надо писать свою функцию.
0
 Аватар для CyberSolver
102 / 75 / 17
Регистрация: 23.07.2014
Сообщений: 877
Записей в блоге: 1
04.08.2014, 17:12
DiffEreD, ну так а чего вы хотели? Кто вам сказал, что один символ равен 1 байту? UTF-8 же. Размер файла 15 байт, вас это не удивило?
0
327 / 230 / 55
Регистрация: 30.05.2014
Сообщений: 682
04.08.2014, 17:22
Цитата Сообщение от DiffEreD Посмотреть сообщение
Надо писать свою функцию.
Надо привести кодировку к UCS-2
0
Модератор
Эксперт С++
 Аватар для zss
13769 / 10962 / 6491
Регистрация: 18.12.2011
Сообщений: 29,238
04.08.2014, 20:06
В соседней теме Issues привел ссылку на такую функция для чтения utf-8 строк:
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
size_t GetSizeOfFile(const std::wstring& path)
{
    struct _stat fileinfo;
    _wstat(path.c_str(), &fileinfo);
    return fileinfo.st_size;
}
 
std::wstring LoadUtf8FileToString(const std::wstring& filename)
{
    std::wstring buffer;            // stores file contents
    FILE* f = _wfopen(filename.c_str(), L"rtS, ccs=UTF-8");
 
    // Failed to open file
    if (f == NULL)
    {
        // ...handle some error...
        return buffer;
    }
 
    size_t filesize = GetSizeOfFile(filename);
 
    // Read entire file contents in to memory
    if (filesize > 0)
    {
        buffer.resize(filesize);
        size_t wchars_read = fread(&(buffer.front()), sizeof(wchar_t), filesize, f);
        buffer.resize(wchars_read);
        buffer.shrink_to_fit();
    }
 
    fclose(f);
 
    return buffer;
}
пример вызова
C++
1
std::wstring mytext = LoadUtf8FileToString(L"C:\\MyUtf8File.txt");
1
19491 / 10097 / 2460
Регистрация: 30.01.2014
Сообщений: 17,805
04.08.2014, 20:24
Лучший ответ Сообщение было отмечено DiffEreD как решение

Решение

DiffEreD, чтобы не писать велосипедов, вот.
1
 Аватар для DiffEreD
1458 / 795 / 257
Регистрация: 21.06.2011
Сообщений: 1,740
Записей в блоге: 2
04.08.2014, 22:49  [ТС]
Короче, проблему решил через ICU. Пока остановлюсь на этом.
C++
1
2
icu::UnicodeString u_str = icu::UnicodeString::fromUTF8(wstr.c_str());
std::cout << "Length wstr is " << u_str.length();
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
04.08.2014, 22:49
Помогаю со студенческими работами здесь

Как можно просчитать(получить) количество возможных вариантов с преставлением местами символов в строке без повторений?
Не знаю даже, сюда или не сюда написал. Но нужна помощь в составлении алгоритма(формулы). Есть строка &quot;123456&quot; как можно...

Как узнать количество комбинаций пароля, если известно количество допустимых и вводимых символов?
№1 Условия: 1) Существует: 20 символов (которые доступны для создания пароля) 2) В табло вводится ни более 4 символов №2 ...

Определить минимальное количество первых символов слов, по которым можно различить слова в строке
Строка состоит из нескольких слов, разделенных пробелом. Определить минимальное количество первых символов слов, по которым можно различить...

Определить минимальное количество первых символов слов, по которым можно различить слова в строке
Строка состоит из нескольких слов, разделенных пробелом. Определить минимальное количество первых символов слов, по которым можно различить...

Определить минимальное количество первых символов слов, по которым можно различить слова в строке
Задание 1 Строка состоит из нескольких слов, разделенных пробелом. Определить минимальное количество первых символов слов, по которым можно...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
14
Ответ Создать тему
Новые блоги и статьи
Кто-нибудь знает, где можно бесплатно получить настольный компьютер или ноутбук? США.
Programma_Boinc 26.12.2025
Кто-нибудь знает, где можно бесплатно получить настольный компьютер или ноутбук? США. Нашел на реддите интересную статью под названием «Кто-нибудь знает, где получить бесплатный компьютер или. . .
Thinkpad X220 Tablet — это лучший бюджетный ноутбук для учёбы, точка.
Programma_Boinc 23.12.2025
Рецензия / Мнение/ Перевод Нашел на реддите интересную статью под названием The Thinkpad X220 Tablet is the best budget school laptop period . Ниже её машинный перевод. Thinkpad X220 Tablet —. . .
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта Симптом: После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
Как объединить две одинаковые БД Access с разными данными
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином. Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов. . . .
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru