Форум программистов, компьютерный форум, киберфорум
Linux
Войти
Регистрация
Восстановить пароль
Карта форума Темы раздела Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.59/32: Рейтинг темы: голосов - 32, средняя оценка - 4.59
4226 / 1795 / 211
Регистрация: 24.11.2009
Сообщений: 27,562
1

Кодировка русских букв.

29.03.2010, 07:09. Показов 6322. Ответов 10
Метки нет (Все метки)

Author24 — интернет-сервис помощи студентам
В linux символы koi8 или какие? Где взять таблицу кодов?
0
Programming
Эксперт
94731 / 64177 / 26122
Регистрация: 12.04.2006
Сообщений: 116,782
29.03.2010, 07:09
Ответы с готовыми решениями:

В текстовом файле вместо русских букв знаки вопроса
Доброго времени суток форумчане. У меня такая проблемка: Решил попробовать какую нить ОС linux,...

В geany (.pas) вместо русских букв выводит иероглифы
Доброе утро/вечер. Я новичок в ОС Ubuntu, вкратце опишу проблему. Поставил IDE geany, для более...

Кодировка русских букв
Такая задача, есть скрипт, который пишет в файл данные и русские буквы прописываются там вот так:...

Кодировка русских букв
Здравствуйте. Такая проблема: есть php-скрипт, который записывает данные в базу MySQL с ошибками....

10
Почетный модератор
7393 / 2639 / 281
Регистрация: 29.07.2006
Сообщений: 13,696
29.03.2010, 09:26 2
юникод
0
4226 / 1795 / 211
Регистрация: 24.11.2009
Сообщений: 27,562
29.03.2010, 11:10  [ТС] 3
А английские почемуто однобайтные.

Добавлено через 5 минут
Где взять таблицы уникодовых русских и английский букв, знаков препинания, цифр и символов: <>=+-*/^&@#$%~№ (выделено красным)? Где взять таблицу однобайтных linuxовых кодов?
0
Эксперт по компьютерным сетямЭксперт NIX
13016 / 7407 / 801
Регистрация: 09.09.2009
Сообщений: 28,986
29.03.2010, 15:04 4
http://unicode.org/charts/PDF/U0400.pdf
второй ответ гугла по запросу "unicode table cyrillic"
думаю, там же по соседству можно найти и все остальное.

ЗЫ. английскому и символам юникод ни к чему, их прекрасно разместили еще в первой СЕМИ-битной таблице символов (в которой других букв и не было-то). Там они по сей день и находятся - в ПЕРВЫХ 128 байтах кодовой таблицы, будь то юникод, ли вин-1251, или кои8р...
0
Эксперт С++
7175 / 3234 / 81
Регистрация: 17.06.2009
Сообщений: 14,164
29.03.2010, 18:40 5
Вопрос неправильный.
Смотря где - где-то KOI8-R, где-то Unicode.
0
4226 / 1795 / 211
Регистрация: 24.11.2009
Сообщений: 27,562
30.03.2010, 05:33  [ТС] 6
В консоли.

Добавлено через 7 минут
Цитата Сообщение от dmkhn Посмотреть сообщение
английскому и символам юникод ни к чему, их прекрасно разместили еще в первой СЕМИ-битной таблице символов (в которой других букв и не было-то).
Про единобезобразие слышал? Если хочу кодировать всё одной разрядностью, то дургого выхода, кроме как поднять разрядность английских букв до уникода нет. А уникод не может быть универсальным (само же название означает universal code - универсальный код), если в нём нет своих кодов для таких букв. Сказано символы всех алфавитов, значит всех, а не кроме английского.

Добавлено через 5 минут
Цитата Сообщение от dmkhn Посмотреть сообщение
Там они по сей день и находятся - в ПЕРВЫХ 128 байтах кодовой таблицы, будь то юникод,...
. Это как? Расширить старшими нулями до двух байт? Результат этого (а может другого стандартного - я не знаю) преобразования - это и есть именно уникодовые, а не ASCII коды символов ASCII. Кодами ASCII они быть уже не могут из-за разрядности.

Добавлено через 54 секунды
И ещё, как там кодируются скобки?
0
4866 / 3288 / 468
Регистрация: 10.12.2008
Сообщений: 10,570
04.04.2010, 06:53 7
Код
[guest@station ~]$ rpm -qf /usr/bin/kcharselect
kdeutils-3.5.8-3.fc8
[guest@station ~]$
Миниатюры
Кодировка русских букв.   Кодировка русских букв.   Кодировка русских букв.  

1
4866 / 3288 / 468
Регистрация: 10.12.2008
Сообщений: 10,570
04.04.2010, 06:55 8
Цитата Сообщение от taras atavin
И ещё, как там кодируются скобки?
Код
[guest@station ~]$ echo "()" | hexdump -C
00000000  28 29 0a                                          |().|
00000003
[guest@station ~]$
0
4866 / 3288 / 468
Регистрация: 10.12.2008
Сообщений: 10,570
04.04.2010, 07:08 9
Код
[guest@station tmp]$ cat uchars.txt
A♖♖♖♖☈☈☈☪☪[guest@station tmp]$
[guest@station tmp]$ cat uchars.txt | hexdump -C
00000000  41 e2 99 96 e2 99 96 e2  99 96 e2 99 96 e2 98 88  |A...............|
00000010  e2 98 88 e2 98 88 e2 98  aa e2 98 aa              |............|
0000001c
[guest@station tmp]$
Миниатюры
Кодировка русских букв.   Кодировка русских букв.   Кодировка русских букв.  

1
4866 / 3288 / 468
Регистрация: 10.12.2008
Сообщений: 10,570
04.04.2010, 07:33 10
почему-то по три байта записывает
0
4226 / 1795 / 211
Регистрация: 24.11.2009
Сообщений: 27,562
05.04.2010, 05:35  [ТС] 11
Из постов № 7 и № 9 следует расширение зазрядности нолями до дух байт. Для ASCII буду юзить это перекодирование в своих программах.
0
05.04.2010, 05:35
IT_Exp
Эксперт
87844 / 49110 / 22898
Регистрация: 17.06.2006
Сообщений: 92,604
05.04.2010, 05:35
Помогаю со студенческими работами здесь

Кодировка русских букв в MacOS
здравствуйте, пишу программу на си под макосью, в качестве компилятора использую Xcode, возникает...

Кодировка русских букв в OnKeyPress
вроде бы все примитивно, но я опять натыкаюсь на грабли с кодировкой: procedure...

Кодировка русских букв в посте
Доброго времени суток. Пользуюсь vk api, требуется опубликовать обычный пост с русскими буквами.....

Кодировка и вывод русских букв
Всем привет. Подскажите, пожалуйста, почему так работает код: import java.io.*; public class IO...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
11
Ответ Создать тему
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2024, CyberForum.ru