Форум программистов, компьютерный форум CyberForum.ru

С++ для начинающих

Войти
Регистрация
Восстановить пароль
 
 
Рейтинг: Рейтинг темы: голосов - 9, средняя оценка - 4.78
diplomat1129
0 / 0 / 0
Регистрация: 11.02.2013
Сообщений: 83
#1

Wchar_t - C++

21.04.2014, 21:51. Просмотров 1209. Ответов 45
Метки нет (Все метки)

подключаюсь к серверу. Присваиваю переменной типа string имя,
C++
1
const char* charName = _Name.c_str();
затем в цикле передаю серверу имя клиента, в цикле делаю следующее:
C++
1
2
3
 
Client.send_data(charName[i]);
cout<<*charName[i];
выводит :
98Data send
32767Data send
-268434792Data send
32767Data send
-1Data send
0Data send
а в имени записано : breathe
Similar
Эксперт
41792 / 34177 / 6122
Регистрация: 12.04.2006
Сообщений: 57,940
21.04.2014, 21:51     Wchar_t
Посмотрите здесь:

Тип wchar_t C++
C++ Конвертация в wchar_t
wchar_t C++
C++ Непонятки с wchar_t
wchar_t в string C++
C++ wchar_t to LPCWSTR
Cannot convert from 'wchar_t' to 'const wchar_t *' C++
После регистрации реклама в сообщениях будет скрыта и будут доступны все возможности форума.
alsav22
5415 / 4811 / 442
Регистрация: 04.06.2011
Сообщений: 13,587
22.04.2014, 14:43     Wchar_t #21
Цитата Сообщение от DrOffset Посмотреть сообщение
Есть стандартный алиас uint16_t/int16_t
Что-то это, стандартное, студия не принимает.

Добавлено через 14 минут
Цитата Сообщение от DrOffset Посмотреть сообщение
Есть стандартный алиас uint16_t/int16_t
И что делать с этим, если широкий символ больше двух байтов?
DrOffset
6851 / 4062 / 927
Регистрация: 30.01.2014
Сообщений: 6,859
22.04.2014, 15:55     Wchar_t #22
Цитата Сообщение от alsav22 Посмотреть сообщение
Что-то это, стандартное, студия не принимает.
Было бы правильнее в стандарт посмотреть, прежде чем студию во главу угла ставить
У меня студии нет сейчас, но по идее это должен быть заголовчный файл <cstdint>. Если это не работает, то в студи есть свои типы для фиксированной разрядности. Кажется с двумя подчеркиваниями вначале.
Цитата Сообщение от alsav22 Посмотреть сообщение
И что делать с этим, если широкий символ больше двух байтов?
Какой-то странный вопрос Очевидно, если требуется сохранять больше двух байт, то надо использовать другой тип. Я же замечание свое высказывал не по поводу символов, а по поводу того, что закладка на посыл в канал wchar_t, при условии что sizeof может быть разным, неверна.
nmcf
4916 / 4254 / 1425
Регистрация: 14.04.2014
Сообщений: 16,718
22.04.2014, 16:07     Wchar_t #23
Для Windows wchar_t будет 2 байта, разве нет?
alsav22
5415 / 4811 / 442
Регистрация: 04.06.2011
Сообщений: 13,587
22.04.2014, 16:08     Wchar_t #24
Цитата Сообщение от DrOffset Посмотреть сообщение
но по идее это должен быть заголовчный файл <cstdint>. Если это не работает
Работает.
DrOffset
6851 / 4062 / 927
Регистрация: 30.01.2014
Сообщений: 6,859
22.04.2014, 16:10     Wchar_t #25
Цитата Сообщение от nmcf Посмотреть сообщение
Для Windows wchar_t будет 2 байта, разве нет?
Для windows, да. Но мы вроде говорим про сетевую передачу
Цитата Сообщение от diplomat1129 Посмотреть сообщение
Мне надо на сервер передавать по 2 байта значения.
как бы вот.
nmcf
4916 / 4254 / 1425
Регистрация: 14.04.2014
Сообщений: 16,718
22.04.2014, 16:12     Wchar_t #26
И что? Передает же приложение Windows.
DrOffset
6851 / 4062 / 927
Регистрация: 30.01.2014
Сообщений: 6,859
22.04.2014, 16:20     Wchar_t #27
Цитата Сообщение от nmcf Посмотреть сообщение
И что? Передает же приложение Windows.
Мне кажется любители холивара не уловили суть. Мы пишем сетевое приложение, следовательно протокол тоже должен быть сетевым, не зависеть от порядка байт и размера типов на платформе. Иначе какой в этой смысл? Приложение, которые работает только на windows? И вообще кто сказал, что у автора windows? А может он посылает с *nix на windows? Если предположить, что он пишет и клиентское и серверное приложения, и не зная про эту особенность, и там и там использует wchar_t, то что получится? Получится послал 4 байта, а ловит 2. Вот такая петрушка.
Еще раз, зная истинное положение вещей, можно делать как угодно. Завязываться на какие угодно тонкости и особенности. Это - ваше дело. Мое дело - донести это самое положение вещей.
nmcf
4916 / 4254 / 1425
Регистрация: 14.04.2014
Сообщений: 16,718
22.04.2014, 16:24     Wchar_t #28
Автор о кроссплатформенности ничего не писал. Я понял, что он делает клиента, а сервер уже есть.
DrOffset
6851 / 4062 / 927
Регистрация: 30.01.2014
Сообщений: 6,859
22.04.2014, 16:35     Wchar_t #29
Цитата Сообщение от nmcf Посмотреть сообщение
Автор о кроссплатформенности ничего не писал. Я понял, что он делает клиента, а сервер уже есть.
Вот были бы мы в разделе WinAPI, я бы слова не сказал А тут если не сказано точно, то можно предполагать что угодно. Есть стандарт языка, который должен быть основным источником разрешения вопросов в разделе по С++. В нем сказано, что размер wchar_t зависит от платформы.
Да и вообще, мы вроде тут учимся как правильно программы писать, а не как себе грабли раскладывать? Или нет?
diplomat1129
0 / 0 / 0
Регистрация: 11.02.2013
Сообщений: 83
22.04.2014, 18:41  [ТС]     Wchar_t #30
Клиент пишу для unix. Сервер писал не я но он работает на винде. Человек который писал сервер и клиент(клиент для винды) говорит надо передавать по 2 байта и использовать для этого wchar
alsav22
5415 / 4811 / 442
Регистрация: 04.06.2011
Сообщений: 13,587
22.04.2014, 18:53     Wchar_t #31
Как насчёт этого?
Цитата Сообщение от alsav22 Посмотреть сообщение
Реализацию send_data() покажите.
DrOffset
6851 / 4062 / 927
Регистрация: 30.01.2014
Сообщений: 6,859
22.04.2014, 19:17     Wchar_t #32
Цитата Сообщение от diplomat1129 Посмотреть сообщение
Клиент пишу для unix.
На unix размер wchar_t - 4 байта. Я об этом выше говорил.
nmcf
4916 / 4254 / 1425
Регистрация: 14.04.2014
Сообщений: 16,718
22.04.2014, 19:28     Wchar_t #33
А как тогда у них обозначают символ как в строках Windows?
DrOffset
6851 / 4062 / 927
Регистрация: 30.01.2014
Сообщений: 6,859
22.04.2014, 19:36     Wchar_t #34
Цитата Сообщение от nmcf Посмотреть сообщение
А как тогда у них обозначают символ как в строках Windows?
Точно так же. Просто код "широкого символа" там 32-разрядный.
Под виндой wchar_t применяется для хранения UCS-2 юникода, которая является вариацией UTF-16.
В Unix wchar_t хранит полноценный UTF-32.
gng
627 / 473 / 128
Регистрация: 08.09.2013
Сообщений: 1,224
22.04.2014, 19:40     Wchar_t #35
Цитата Сообщение от diplomat1129 Посмотреть сообщение
Клиент пишу для unix. Сервер писал не я но он работает на винде. Человек который писал сервер и клиент(клиент для винды) говорит надо передавать по 2 байта и использовать для этого wchar
DrOffset вам пояснил, что это концептуально неверно, поскольку wchar на разных платформах и в разных системах различаются и по размеру, и по порядку следования байт.
Думаю, стоит связаться "человеком, который писал сервер" и уточнить постановку задачи.
Самый удобный текстовый формат для сетевого взаимодействия - utf-8.
nmcf
4916 / 4254 / 1425
Регистрация: 14.04.2014
Сообщений: 16,718
22.04.2014, 19:53     Wchar_t #36
Я знаю про utf16, вопрос как в Unix такой тип обозначается и как с такими строками работают, если char 1 байт, а wchar_t 4 байта.
DrOffset
6851 / 4062 / 927
Регистрация: 30.01.2014
Сообщений: 6,859
22.04.2014, 19:56     Wchar_t #37
diplomat1129, кстати, если доступен новый стандарт (c++11), то в принципе можно легко обеспечить строку utf-16, соответственно гарантировать 2 байта.
C++
1
2
3
4
int main(int argc, char *argv[])
{
    const char16_t buf[] = u"12345678";
}
Добавлено через 2 минуты
Цитата Сообщение от nmcf Посмотреть сообщение
вопрос как в Unix такой тип обозначается и как с такими строками работают, если char 1 байт, а wchar_t 4 байта.
C++
1
2
wchar_t wstr[] = L"test"; 
char     str[] = "test";
Точно так же, говорю же. Есть же API для wchar_t, через него и работают. А вообще в UNIX принята довольно давно utf-8, поэтому там строки преимущественно char.
nmcf
4916 / 4254 / 1425
Регистрация: 14.04.2014
Сообщений: 16,718
22.04.2014, 19:58     Wchar_t #38
А промежуточный между 1 и 4 двухбайтовый char как?
DrOffset
6851 / 4062 / 927
Регистрация: 30.01.2014
Сообщений: 6,859
22.04.2014, 20:11     Wchar_t #39
Цитата Сообщение от nmcf Посмотреть сообщение
А промежуточный между 1 и 4 двухбайтовый char как?
Промежуточный, это какой? utf-16 что ли? В iconv например со всеми вариантами работают через char. Просто каждый байт в такой строке обозначает не символ, а часть символа utf-16/utf-32. В некоторых библиотеках специальные типы данных сделаны, например в ICU - это UChar, который принимает разную разрядность в зависимости от настроек. В Qt - это QChar. Все это от того, что в языке не было нативной поддержки строковых литералов нужной "ширины". В винде на самом деле те же проблемы. Как записать литерал в UTF-32?
В связи с этим в unix повсеместно используется utf-8, так удобнее намного и с поддержкой языка проблем нет. А в win все системное API давно нативно поддерживает utf-16, поэтому и wchar_t там сделан 2-байтовым, опять же для удобства.
Впрочем С++11 решает все эти проблемы, позволяя определять литералы любой "ширины" стандартным способом.
MoreAnswers
Эксперт
37091 / 29110 / 5898
Регистрация: 17.06.2006
Сообщений: 43,301
22.04.2014, 20:15     Wchar_t
Еще ссылки по теме:

C++ Wchar_t to char
Чтение wchar_t C++
C++ String в wchar_t*
C++ CP886 в Multibyte (wchar_t) и BYTE в Multibyte (wchar_t)
Wchar_t и unsigned wchar_t в windows C++

Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
nmcf
4916 / 4254 / 1425
Регистрация: 14.04.2014
Сообщений: 16,718
22.04.2014, 20:15     Wchar_t #40
Понятно. А с int что? Его размер в байтах также непредсказуем?
Yandex
Объявления
22.04.2014, 20:15     Wchar_t
Ответ Создать тему
Опции темы

Текущее время: 14:03. Часовой пояс GMT +3.
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2017, vBulletin Solutions, Inc.
Рейтинг@Mail.ru