|
3 / 2 / 2
Регистрация: 14.12.2009
Сообщений: 149
|
|
Linux кириллица в файлах26.08.2020, 01:14. Показов 9770. Ответов 24
Метки нет (Все метки)
здравствуйте
вопрос: как работать с файлами в линукс, если в них присутствует кириллица? если открываю используя fstream и считываю getline то на месте кириллических символов символы с отрицательными кодами если открываю используя wfstream и считываю также getline, то на месте первого кириллического символа завершающий символ '\0'
0
|
|
| 26.08.2020, 01:14 | |
|
Ответы с готовыми решениями:
24
Кириллица в файлах |
|
Почетный модератор
7393 / 2639 / 281
Регистрация: 29.07.2006
Сообщений: 13,696
|
|
| 26.08.2020, 01:19 | |
|
0
|
|
|
4082 / 2680 / 432
Регистрация: 09.09.2017
Сообщений: 11,900
|
||
| 26.08.2020, 10:13 | ||
|
Скорее всего, вы читаете в обычном UTF-8, где кириллический символ кодируется двумя последовательными байтами. Скажем, буква 'А' имеет код 0xD090, буква 'Ф' - 0xD0A4.
0
|
||
|
2670 / 1333 / 479
Регистрация: 08.11.2016
Сообщений: 3,679
|
||
| 26.08.2020, 12:16 | ||
char по умолчанию может быть как signed так и unsigned зависит от компилятора. MSVC, например, по умолчанию задает для типа char тип signed char, но при указании компилятору опции /J меняет поведение и ставит по умолчанию тип unsigned char
0
|
||
|
3 / 2 / 2
Регистрация: 14.12.2009
Сообщений: 149
|
|||
| 26.08.2020, 18:14 [ТС] | |||
|
Получается как с этим работать, как мне получить массив символов, что бы кириллические символы там были нормальными?
0
|
|||
|
4082 / 2680 / 432
Регистрация: 09.09.2017
Сообщений: 11,900
|
||||||
| 27.08.2020, 09:40 | ||||||
|
Так и работать, в чем проблема-то?
Опишите что вы хотите сделать и что у вас не получается. Вот пример работы с файлом, и имя кириллическое, и содержимое. Все работает.
0
|
||||||
|
Почетный модератор
7393 / 2639 / 281
Регистрация: 29.07.2006
Сообщений: 13,696
|
|||||||
| 27.08.2020, 10:47 | |||||||
0
|
|||||||
|
3 / 2 / 2
Регистрация: 14.12.2009
Сообщений: 149
|
|
| 27.08.2020, 12:22 [ТС] | |
|
Так все работает
Тогда проблема в следующем: в иде, в режиме дебага, если посмотреть содержимое строки , то на месте кириллических символов отрицательные коды
0
|
|
|
3 / 2 / 2
Регистрация: 14.12.2009
Сообщений: 149
|
|
| 27.08.2020, 12:31 [ТС] | |
|
И ещё кириллические символы занимют два позиции в массиве .
Как с этим быть?
0
|
|
|
3 / 2 / 2
Регистрация: 14.12.2009
Сообщений: 149
|
|
| 27.08.2020, 12:39 [ТС] | |
|
Просто тогда уже неудобно считать длину строки
Модно сконвертировать в wchar_t что бы и Анг и русск символы были по 1 позиции в массиве?
0
|
|
|
4082 / 2680 / 432
Регистрация: 09.09.2017
Сообщений: 11,900
|
|
| 27.08.2020, 12:55 | |
|
Еще раз предлагаю просто описать задачу, которую пытаетесь решить.
Если вам нужно просто хранить строки, вводить и выводить их без существенной обработки используйте UTF-8 и не парьтесь. Если нужна обработка вроде подсчета размера, копирование-вставка в середину и т.п. (не самый частый класс задач) то можно попробовать в wchar_t.
0
|
|
|
3 / 2 / 2
Регистрация: 14.12.2009
Сообщений: 149
|
|||
| 27.08.2020, 13:36 [ТС] | |||
|
0
|
|||
|
4082 / 2680 / 432
Регистрация: 09.09.2017
Сообщений: 11,900
|
||
| 27.08.2020, 13:50 | ||
|
А для совсем серьезной обработки (хотя бы приведение к верхнему/нижнему регистру) простого wchar_t не хватит, нужна будет дополнительная обработка. Как и с составными символам, в которые входят диактрические модификаторы: с ними даже не все стандартные утилиты работают правильно.
0
|
||
|
|
|
| 27.08.2020, 13:50 | |
|
Fatinho, а может в UnicodeString сразу? Зачем изобретать велосипед.
0
|
|
|
3 / 2 / 2
Регистрация: 14.12.2009
Сообщений: 149
|
||
| 27.08.2020, 14:03 [ТС] | ||
|
Мне нужно считать файл, содержимое которого вперемешку латинские и кириллические символы, в массив символов и обрабатывать его так же как я бы обрабатывал его будь это просто массив латинских симвлов. То есть пользоваться такими функциями как strcpy, strncpy, strcat, strcspn и т.д. Чтобы 1 элемент массива, был бы одним символом
0
|
||
|
4082 / 2680 / 432
Регистрация: 09.09.2017
Сообщений: 11,900
|
|||
| 27.08.2020, 20:21 | |||
|
0
|
|||
| 27.08.2020, 20:21 | |
|
Помогаю со студенческими работами здесь
20
Кириллица в bat-файлах
Какая СУБД хранит данные в файлах с расширением .dat и индексы в файлах .k01, k02 и т.д.? [Mono] Подскажите ide c# под linux чтобы компилировался файл для linux Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
||||
|
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост.
Programma_Boinc 28.12.2025
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост.
Налог на собак: https:/ / **********/ gallery/ V06K53e
Финансовый отчет в Excel: https:/ / **********/ gallery/ bKBkQFf
Пост отсюда. . .
|
Кто-нибудь знает, где можно бесплатно получить настольный компьютер или ноутбук? США.
Programma_Boinc 26.12.2025
Нашел на реддите интересную статью под названием Anyone know where to get a free Desktop or Laptop?
Ниже её машинный перевод.
После долгих разбирательств я наконец-то вернула себе. . .
|
Thinkpad X220 Tablet — это лучший бюджетный ноутбук для учёбы, точка.
Programma_Boinc 23.12.2025
Рецензия / Мнение/ Перевод
Нашел на реддите интересную статью под названием The Thinkpad X220 Tablet is the best budget school laptop period . Ниже её машинный перевод.
Thinkpad X220 Tablet —. . .
|
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта
Симптом:
После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
|
Как объединить две одинаковые БД Access с разными данными
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
|
|
Новый ноутбук
volvo 07.12.2025
Всем привет.
По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне:
Ryzen 5 7533HS
64 Gb DDR5
1Tb NVMe
16" Full HD Display
Win11 Pro
|
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
|
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
|
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов
На странице:
https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/
нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
|
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов.
. . .
|