Форум программистов, компьютерный форум, киберфорум
С++ для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 5.00/11: Рейтинг темы: голосов - 11, средняя оценка - 5.00
 Аватар для DiffEreD
1458 / 795 / 257
Регистрация: 21.06.2011
Сообщений: 1,740
Записей в блоге: 2

Как правильно можно узнать количество хранимых в строке символов?

04.08.2014, 13:39. Показов 2532. Ответов 13
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Есть строка с юникод символами. Как правильно можно узнать количество хранимых в строке символов?
C++
1
2
3
4
5
6
7
8
9
int main()
{
   std::wifstream wifs("file.txt");
   std::wstring wstr;
   wifs >> wstr; // 5 юникод символов
   std::cout << "Size: " << wstr.size() << "\n"; //выводит 15
 
   return 0;
}
0
Лучшие ответы (1)
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
04.08.2014, 13:39
Ответы с готовыми решениями:

Как узнать о наличии определенных символов в строке и их количество
Есть последовательности типа &quot;1,5,4,7,8,9,6,35,5&quot; или &quot;4567&quot; или &quot;45-56-78-45&quot; Нужно одной строчкой узнать есть ли там...

Как узнать количество символов в строке, с русскоязычными символами?
Всем доброго времени суток, сложилась такая ситуация, в поле input вводится текст, его длина должна быть от 10 до 70 символов, решил...

Как правильно посчитать количество символов в строке после чтения файла антивордом?
Добрый день. Суть задачи: сосчитать количество символов в файле .doc Перепробовал кучу методов, каждый был в чем-то плох. Где-то...

13
Эксперт С++
4986 / 3093 / 456
Регистрация: 10.11.2010
Сообщений: 11,170
Записей в блоге: 10
04.08.2014, 14:09
wstr.length() должна возвращать длину в символах, как и wstr.size().
0
 Аватар для DiffEreD
1458 / 795 / 257
Регистрация: 21.06.2011
Сообщений: 1,740
Записей в блоге: 2
04.08.2014, 15:58  [ТС]
Нет, выводит то же что и size().

Добавлено через 3 минуты
В строке находятся примерно такие каракули: ᴔᴕᴗᴭᴣ

Добавлено через 1 час 42 минуты
Разве что такие грабли писать:
C++
1
2
3
4
5
6
size_t utf8len(const wchar_t *s)
{
    size_t len = 0;
    for (; *s; ++s) if ((*s & 0xC0) != 0x80) ++len;
    return len;
}
0
 Аватар для CyberSolver
102 / 75 / 17
Регистрация: 23.07.2014
Сообщений: 877
Записей в блоге: 1
04.08.2014, 16:05
DiffEreD, входной файл прикрепить можете?
0
 Аватар для DiffEreD
1458 / 795 / 257
Регистрация: 21.06.2011
Сообщений: 1,740
Записей в блоге: 2
04.08.2014, 16:07  [ТС]
Да пожалуйста:
Вложения
Тип файла: txt file.txt (15 байт, 13 просмотров)
0
 Аватар для CyberSolver
102 / 75 / 17
Регистрация: 23.07.2014
Сообщений: 877
Записей в блоге: 1
04.08.2014, 16:22
DiffEreD, сообщение компилятора:
terminate called after throwing an instance of 'std::ios_base::failure'
what(): basic_filebuf::underflow invalid byte sequence in file

Может дело в кодировке входного файла? Сохранил как UTF-16 - выдал 10. Может у вас там utf-8?
0
 Аватар для DiffEreD
1458 / 795 / 257
Регистрация: 21.06.2011
Сообщений: 1,740
Записей в блоге: 2
04.08.2014, 16:29  [ТС]
У меня там UTF-8
0
 Аватар для CyberSolver
102 / 75 / 17
Регистрация: 23.07.2014
Сообщений: 877
Записей в блоге: 1
04.08.2014, 16:46
DiffEreD, тогда просто читайте как string. Потому что wstring - это по 2 байта.
0
 Аватар для DiffEreD
1458 / 795 / 257
Регистрация: 21.06.2011
Сообщений: 1,740
Записей в блоге: 2
04.08.2014, 16:58  [ТС]
Это сути не меняет. size() все равно не выведет количество символов. Надо писать свою функцию.
0
 Аватар для CyberSolver
102 / 75 / 17
Регистрация: 23.07.2014
Сообщений: 877
Записей в блоге: 1
04.08.2014, 17:12
DiffEreD, ну так а чего вы хотели? Кто вам сказал, что один символ равен 1 байту? UTF-8 же. Размер файла 15 байт, вас это не удивило?
0
327 / 230 / 55
Регистрация: 30.05.2014
Сообщений: 682
04.08.2014, 17:22
Цитата Сообщение от DiffEreD Посмотреть сообщение
Надо писать свою функцию.
Надо привести кодировку к UCS-2
0
Модератор
Эксперт С++
 Аватар для zss
13773 / 10966 / 6491
Регистрация: 18.12.2011
Сообщений: 29,244
04.08.2014, 20:06
В соседней теме Issues привел ссылку на такую функция для чтения utf-8 строк:
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
size_t GetSizeOfFile(const std::wstring& path)
{
    struct _stat fileinfo;
    _wstat(path.c_str(), &fileinfo);
    return fileinfo.st_size;
}
 
std::wstring LoadUtf8FileToString(const std::wstring& filename)
{
    std::wstring buffer;            // stores file contents
    FILE* f = _wfopen(filename.c_str(), L"rtS, ccs=UTF-8");
 
    // Failed to open file
    if (f == NULL)
    {
        // ...handle some error...
        return buffer;
    }
 
    size_t filesize = GetSizeOfFile(filename);
 
    // Read entire file contents in to memory
    if (filesize > 0)
    {
        buffer.resize(filesize);
        size_t wchars_read = fread(&(buffer.front()), sizeof(wchar_t), filesize, f);
        buffer.resize(wchars_read);
        buffer.shrink_to_fit();
    }
 
    fclose(f);
 
    return buffer;
}
пример вызова
C++
1
std::wstring mytext = LoadUtf8FileToString(L"C:\\MyUtf8File.txt");
1
19500 / 10105 / 2461
Регистрация: 30.01.2014
Сообщений: 17,816
04.08.2014, 20:24
Лучший ответ Сообщение было отмечено DiffEreD как решение

Решение

DiffEreD, чтобы не писать велосипедов, вот.
1
 Аватар для DiffEreD
1458 / 795 / 257
Регистрация: 21.06.2011
Сообщений: 1,740
Записей в блоге: 2
04.08.2014, 22:49  [ТС]
Короче, проблему решил через ICU. Пока остановлюсь на этом.
C++
1
2
icu::UnicodeString u_str = icu::UnicodeString::fromUTF8(wstr.c_str());
std::cout << "Length wstr is " << u_str.length();
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
04.08.2014, 22:49
Помогаю со студенческими работами здесь

Как можно просчитать(получить) количество возможных вариантов с преставлением местами символов в строке без повторений?
Не знаю даже, сюда или не сюда написал. Но нужна помощь в составлении алгоритма(формулы). Есть строка &quot;123456&quot; как можно...

Как узнать количество комбинаций пароля, если известно количество допустимых и вводимых символов?
№1 Условия: 1) Существует: 20 символов (которые доступны для создания пароля) 2) В табло вводится ни более 4 символов №2 ...

Определить минимальное количество первых символов слов, по которым можно различить слова в строке
Строка состоит из нескольких слов, разделенных пробелом. Определить минимальное количество первых символов слов, по которым можно различить...

Определить минимальное количество первых символов слов, по которым можно различить слова в строке
Строка состоит из нескольких слов, разделенных пробелом. Определить минимальное количество первых символов слов, по которым можно различить...

Определить минимальное количество первых символов слов, по которым можно различить слова в строке
Задание 1 Строка состоит из нескольких слов, разделенных пробелом. Определить минимальное количество первых символов слов, по которым можно...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
14
Ответ Создать тему
Новые блоги и статьи
SDL3 для Web (WebAssembly): Реализация движения на Box2D v3 - трение и коллизии с повёрнутыми стенами
8Observer8 20.02.2026
Содержание блога Box2D позволяет легко создать главного героя, который не проходит сквозь стены и перемещается с заданным трением о препятствия, которые можно располагать под углом, как верхнее. . .
Конвертировать закладки radiotray-ng в m3u-плейлист
damix 19.02.2026
Это можно сделать скриптом для PowerShell. Использование . \СonvertRadiotrayToM3U. ps1 <path_to_bookmarks. json> Рядом с файлом bookmarks. json появится файл bookmarks. m3u с результатом. # Check if. . .
Семь CDC на одном интерфейсе: 5 U[S]ARTов, 1 CAN и 1 SSI
Eddy_Em 18.02.2026
Постепенно допиливаю свою "многоинтерфейсную плату". Выглядит вот так: https:/ / www. cyberforum. ru/ blog_attachment. php?attachmentid=11617&stc=1&d=1771445347 Основана на STM32F303RBT6. На борту пять. . .
Камера Toupcam IUA500KMA
Eddy_Em 12.02.2026
Т. к. у всяких "хикроботов" слишком уж мелкий пиксель, для подсмотра в ESPriF они вообще плохо годятся: уже 14 величину можно рассмотреть еле-еле лишь на экспозициях под 3 секунды (а то и больше),. . .
И ясному Солнцу
zbw 12.02.2026
И ясному Солнцу, и светлой Луне. В мире покоя нет и люди не могут жить в тишине. А жить им немного лет.
«Знание-Сила»
zbw 12.02.2026
«Знание-Сила» «Время-Деньги» «Деньги -Пуля»
SDL3 для Web (WebAssembly): Подключение Box2D v3, физика и отрисовка коллайдеров
8Observer8 12.02.2026
Содержание блога Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами и вызывать обработчики событий столкновения. . . .
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 11.02.2026
Содержание блога Библиотека SDL3 содержит встроенные инструменты для базовой работы с изображениями - без использования библиотеки SDL3_image. Пошагово создадим проект для загрузки изображения. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru