С наступающим Новым годом! Форум программистов, компьютерный форум, киберфорум
Наши страницы
Linux
Войти
Регистрация
Восстановить пароль
 
Рейтинг 4.52/23: Рейтинг темы: голосов - 23, средняя оценка - 4.52
taras atavin
4205 / 1768 / 211
Регистрация: 24.11.2009
Сообщений: 27,565
1

Кодировка русских букв.

29.03.2010, 07:09. Просмотров 4281. Ответов 10
Метки нет (Все метки)

В linux символы koi8 или какие? Где взять таблицу кодов?
0
Similar
Эксперт
41792 / 34177 / 6122
Регистрация: 12.04.2006
Сообщений: 57,940
29.03.2010, 07:09
Ответы с готовыми решениями:

В текстовом файле вместо русских букв знаки вопроса
Доброго времени суток форумчане. У меня такая проблемка: Решил попробовать...

В geany (.pas) вместо русских букв выводит иероглифы
Доброе утро/вечер. Я новичок в ОС Ubuntu, вкратце опишу проблему. Поставил IDE...

Тема о русских дистрибутивах linux
Какие есть дистрибутивы с русским языком? И есть ли Zorin OS на русском?

Кодировка русских букв
Такая задача, есть скрипт, который пишет в файл данные и русские буквы...

Кодировка русских букв
Здравствуйте. Такая проблема: есть php-скрипт, который записывает данные в базу...

10
Vourhey
Почетный модератор
6493 / 2268 / 185
Регистрация: 29.07.2006
Сообщений: 12,534
29.03.2010, 09:26 2
юникод
0
taras atavin
4205 / 1768 / 211
Регистрация: 24.11.2009
Сообщений: 27,565
29.03.2010, 11:10  [ТС] 3
А английские почемуто однобайтные.

Добавлено через 5 минут
Где взять таблицы уникодовых русских и английский букв, знаков препинания, цифр и символов: <>=+-*/^&@#$%~№ (выделено красным)? Где взять таблицу однобайтных linuxовых кодов?
0
Dmitry
Эксперт по компьютерным сетямЭксперт NIX
10787 / 6108 / 470
Регистрация: 09.09.2009
Сообщений: 24,282
29.03.2010, 15:04 4
http://unicode.org/charts/PDF/U0400.pdf
второй ответ гугла по запросу "unicode table cyrillic"
думаю, там же по соседству можно найти и все остальное.

ЗЫ. английскому и символам юникод ни к чему, их прекрасно разместили еще в первой СЕМИ-битной таблице символов (в которой других букв и не было-то). Там они по сей день и находятся - в ПЕРВЫХ 128 байтах кодовой таблицы, будь то юникод, ли вин-1251, или кои8р...
0
odip
Эксперт С++
7164 / 3222 / 77
Регистрация: 17.06.2009
Сообщений: 14,160
29.03.2010, 18:40 5
Вопрос неправильный.
Смотря где - где-то KOI8-R, где-то Unicode.
0
taras atavin
4205 / 1768 / 211
Регистрация: 24.11.2009
Сообщений: 27,565
30.03.2010, 05:33  [ТС] 6
В консоли.

Добавлено через 7 минут
Цитата Сообщение от dmkhn Посмотреть сообщение
английскому и символам юникод ни к чему, их прекрасно разместили еще в первой СЕМИ-битной таблице символов (в которой других букв и не было-то).
Про единобезобразие слышал? Если хочу кодировать всё одной разрядностью, то дургого выхода, кроме как поднять разрядность английских букв до уникода нет. А уникод не может быть универсальным (само же название означает universal code - универсальный код), если в нём нет своих кодов для таких букв. Сказано символы всех алфавитов, значит всех, а не кроме английского.

Добавлено через 5 минут
Цитата Сообщение от dmkhn Посмотреть сообщение
Там они по сей день и находятся - в ПЕРВЫХ 128 байтах кодовой таблицы, будь то юникод,...
. Это как? Расширить старшими нулями до двух байт? Результат этого (а может другого стандартного - я не знаю) преобразования - это и есть именно уникодовые, а не ASCII коды символов ASCII. Кодами ASCII они быть уже не могут из-за разрядности.

Добавлено через 54 секунды
И ещё, как там кодируются скобки?
0
accept
4833 / 3255 / 461
Регистрация: 10.12.2008
Сообщений: 10,569
04.04.2010, 06:53 7
Код
[guest@station ~]$ rpm -qf /usr/bin/kcharselect
kdeutils-3.5.8-3.fc8
[guest@station ~]$
1
Миниатюры
Кодировка русских букв.   Кодировка русских букв.   Кодировка русских букв.  

accept
4833 / 3255 / 461
Регистрация: 10.12.2008
Сообщений: 10,569
04.04.2010, 06:55 8
Цитата Сообщение от taras atavin
И ещё, как там кодируются скобки?
Код
[guest@station ~]$ echo "()" | hexdump -C
00000000  28 29 0a                                          |().|
00000003
[guest@station ~]$
0
accept
4833 / 3255 / 461
Регистрация: 10.12.2008
Сообщений: 10,569
04.04.2010, 07:08 9
Код
[guest@station tmp]$ cat uchars.txt
A♖♖♖♖☈☈☈☪☪[guest@station tmp]$
[guest@station tmp]$ cat uchars.txt | hexdump -C
00000000  41 e2 99 96 e2 99 96 e2  99 96 e2 99 96 e2 98 88  |A...............|
00000010  e2 98 88 e2 98 88 e2 98  aa e2 98 aa              |............|
0000001c
[guest@station tmp]$
1
Миниатюры
Кодировка русских букв.   Кодировка русских букв.   Кодировка русских букв.  

accept
4833 / 3255 / 461
Регистрация: 10.12.2008
Сообщений: 10,569
04.04.2010, 07:33 10
почему-то по три байта записывает
0
taras atavin
4205 / 1768 / 211
Регистрация: 24.11.2009
Сообщений: 27,565
05.04.2010, 05:35  [ТС] 11
Из постов № 7 и № 9 следует расширение зазрядности нолями до дух байт. Для ASCII буду юзить это перекодирование в своих программах.
0
05.04.2010, 05:35
MoreAnswers
Эксперт
37091 / 29110 / 5898
Регистрация: 17.06.2006
Сообщений: 43,301
05.04.2010, 05:35

Кодировка русских букв в OnKeyPress
вроде бы все примитивно, но я опять натыкаюсь на грабли с кодировкой: ...

Кодировка русских букв в MacOS
здравствуйте, пишу программу на си под макосью, в качестве компилятора...

Кодировка русских букв в посте
Доброго времени суток. Пользуюсь vk api, требуется опубликовать обычный пост с...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
11
Ответ Создать тему
Опции темы

КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2018, vBulletin Solutions, Inc.
Рейтинг@Mail.ru