Форум программистов, компьютерный форум CyberForum.ru

Кроссплатформенный перевод русских букв в верхний/нижний регистр - C++

Восстановить пароль Регистрация
 
Aitar
0 / 0 / 0
Регистрация: 25.09.2013
Сообщений: 18
15.04.2014, 11:42     Кроссплатформенный перевод русских букв в верхний/нижний регистр #1
Добрый день.
В прикрепленном топике описываются способы вывода русских букв на консоль. Но они почти все подвязаны под винду.
Более того, стандартная функция std::tolower/toupper не работает с русскими буквами.
Подскажите кроссплатформенный вариант перевода русских букв в другой регистр, считывать я буду с std::cin, файлов.
Нужна работа на nix и винде. Пробовал буст, но он тоже работает только с англо буквами. Если подцепляться конкретно к винде, то не будет компилиться под nix системами. Вот в чём проблема.
Лучшие ответы (1)
Similar
Эксперт
41792 / 34177 / 6122
Регистрация: 12.04.2006
Сообщений: 57,940
15.04.2014, 11:42     Кроссплатформенный перевод русских букв в верхний/нижний регистр
Посмотрите здесь:

Перевод символа в нижний регистр C++
Перевод букв в нижний регистр C++
Строки в С++. Верхний и нижний регистр C++
Преобразование строки сначала в верхний регистр, потом в нижний C++
C++ Верхний и нижний регистр
После регистрации реклама в сообщениях будет скрыта и будут доступны все возможности форума.
DrOffset
6426 / 3800 / 880
Регистрация: 30.01.2014
Сообщений: 6,594
15.04.2014, 12:19     Кроссплатформенный перевод русских букв в верхний/нижний регистр #2
Aitar, Оно работает с русскими буквами. Нужно только верную локаль выставить.
Aitar
0 / 0 / 0
Регистрация: 25.09.2013
Сообщений: 18
16.04.2014, 02:05  [ТС]     Кроссплатформенный перевод русских букв в верхний/нижний регистр #3
Пробовал с "rus" - не работало.
С rus_rus.866 работает.
Будет ли этотже способ работать и под nix системами ?
Как я понял какую локаль ставить зависит от кодировки текстового файла. А что если предполагается подача файла с разными кодировками ?
IrineK
Заблокирован
16.04.2014, 03:00     Кроссплатформенный перевод русских букв в верхний/нижний регистр #4
Напишите руками.
Тут gazlan уже toupper сделал и чисто для консоли и для вывода в файл:
Написать программу перевода строчных букв в прописные буквы
Написать программу перевода строчных букв в прописные буквы

Назад - аналогично.
Посмотрите кодировки СР866 и СР1251 и уясните, что и когда нужно.
Вложения
Тип файла: pdf ascii.pdf (164.5 Кб, 9 просмотров)
DrOffset
6426 / 3800 / 880
Регистрация: 30.01.2014
Сообщений: 6,594
16.04.2014, 09:36     Кроссплатформенный перевод русских букв в верхний/нижний регистр #5
Сообщение было отмечено автором темы, экспертом или модератором как ответ
Цитата Сообщение от Aitar Посмотреть сообщение
Как я понял какую локаль ставить зависит от кодировки текстового файла.
Локаль не зависит от кодировки текстового файла. От кодировки текстового файла зависит то, что будет содержать строка. Общий и правильный подход - не зашивать локализованные строки в исходник. Посмотри на подход, который предлагает Qt, основная суть:
1) Представление строк приложения едино (юникод);
2) Локализованные строки хранятся отдельно в контролируемом месте в какой-то конкретной кодировке;
3) Программа по-умолчанию использует текущую системную локаль.
----
Если брать конкретно функции toupper и tolower, то это дожны быть функции, которые работают с юникодом. Под windows принято использовать wchar_t варианты строк (ucs-2), в unix практически повсеместно используется char (utf-8).

Цитата Сообщение от Aitar Посмотреть сообщение
Будет ли этотже способ работать и под nix системами ?
Будет, только локаль там называется подругому. Это, можно считать, настроечная информация. Она должна определяться при старте программы (или в настройках).

По поводу кодировок и компилятора:
GCC - по-умолчанию считает, что файл в кодировке UTF-8. VC++, кажется, ставит кодировку в соответствии с локализацией системы, т.е. для русской windows это будет CP1251. Именно исходя из этого, хранить локализованные строки в исходнике - неправильно.
По поводу самописных вещей - зачем, когда есть стандартные. CP1251 почти не применяется в *nix, да и завязываться на однобайтную кодировку когда весь мир использует юникод - точно непортабельно.
Yandex
Объявления
16.04.2014, 09:36     Кроссплатформенный перевод русских букв в верхний/нижний регистр
Ответ Создать тему
Опции темы

Текущее время: 17:55. Часовой пояс GMT +3.
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2016, vBulletin Solutions, Inc.
Рейтинг@Mail.ru