|
1 / 1 / 0
Регистрация: 31.03.2014
Сообщений: 78
|
|
Unicode и UTF-828.09.2014, 19:50. Показов 2921. Ответов 3
Метки нет (Все метки)
Всем Доброго!
Объясните пожалуйста, что такое Unicode и UTF-8. Не нужно только давать ссылки на поисковые системы и на консорциум - не пять лет .Везде отвечают "шаблоном wiki", а это говорит о том, что человек либо не знает о чем говорит, либо сам толком не разобрался. Как я понимаю на данный момент: Unicode (как стандарт) - представление символов, в котором каждому символу присвоен свой номер в таблице ... Unicode (как кодировка) - один из способов преобразования символов Unicode в машинный код. UTF-8 - один (более универсальный) из способов преобразования символов Unicode в машинный код. Объясните "на пальцах", без "заумных" слов, желательно с примером. Спасибо.
0
|
|
| 28.09.2014, 19:50 | |
|
Ответы с готовыми решениями:
3
Php unicode Сменить кодировку строки на Unicode |
|
Ушел с форума
|
|
| 28.09.2014, 20:54 | |
|
Unicode - это стандарт кодирования символов самых разных языков мира.
Для каждой буквы, символа или какого-то специального знака в Unicode определена соответствующая позиция, называется она "кодовая точка". Например, кириллической букве "Ф" соответствует кодовая точка U+0424. Но сам Unicode не определяет, как именно должен храниться текст. Проще говоря, не определяет, как записать кодовую точку U+0424 в набор байт. Для этого и существуют UTF-8, UTF-16, UTF-32 и т.п. Например, в UTF-32 каждому символу отводится 4 байта, причем существуют еще вариации с разным порядком байт - Big Endian (старший байт идет вначале, затем младший) и Little Endian (сначала младший байт, после него старший), из-за чего, к примеру, UTF-16 бывает двух видов: UTF-16LE и UTF-16BE. Конкретно в UTF-8 принята такая схема: коды латинских символов, а также стандартные символы типа пробела, кавычек и т.п., занимают 1 байт и соответствуют кодам ASCII. Размер других символов занимает от 2 до 6 байт и формируется с помощью специального префикса (в Википедии есть пример). В общем, Unicode - это стандарт кодирования, а UTF-8 - один из способов хранения/представления юникодных символов.
1
|
|
|
1 / 1 / 0
Регистрация: 31.03.2014
Сообщений: 78
|
|
| 28.09.2014, 21:59 [ТС] | |
|
Убежденный, спасибо за разъяснение.
P. S. Пост, который подтверждает Ваш ответ на мой вопрос и который внес ясность в мое недопонимание: http://www.rrn.dk/the-differen... nd-unicode .
0
|
|
|
1 / 1 / 0
Регистрация: 31.03.2014
Сообщений: 78
|
|
| 13.12.2014, 22:32 [ТС] | |
|
Мой перевод указанной выше статьи: Чем отличаются UTF-8 и Unicode?.
0
|
|
| 13.12.2014, 22:32 | |
|
Помогаю со студенческими работами здесь
4
base64_encode для символов Unicode из MSSQL Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
Инструменты COM: Сохранение данный из VARIANT в файл и загрузка из файла в VARIANT
bedvit 28.01.2026
Сохранение базовых типов COM и массивов (одномерных или двухмерных) любой вложенности (деревья) в файл, с возможностью выбора алгоритмов сжатия и шифрования.
Часть библиотеки BedvitCOM
Использованы. . .
|
Загрузка PNG с альфа-каналом на SDL3 для Android: с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 28.01.2026
Содержание блога
SDL3 имеет собственные средства для загрузки и отображения PNG-файлов с альфа-каналом и базовой работы с ними. В этой инструкции используется функция SDL_LoadPNG(), которая. . .
|
Загрузка PNG с альфа-каналом на SDL3 для Android: с помощью SDL3_image
8Observer8 27.01.2026
Содержание блога
SDL3_image - это библиотека для загрузки и работы с изображениями. Эта пошаговая инструкция покажет, как загрузить и вывести на экран смартфона картинку с альфа-каналом, то есть с. . .
|
влияние грибов на сукцессию
anaschu 26.01.2026
Бифуркационные изменения массы гриба происходят тогда, когда мы уменьшаем массу компоста в 10 раз, а скорость прироста биомассы уменьшаем в три раза. Скорость прироста биомассы может уменьшаться за. . .
|
|
Воспроизведение звукового файла с помощью SDL3_mixer при касании экрана Android
8Observer8 26.01.2026
Содержание блога
SDL3_mixer - это библиотека я для воспроизведения аудио. В отличие от инструкции по добавлению текста код по проигрыванию звука уже содержится в шаблоне примера. Нужно только. . .
|
Установка Android SDK, NDK, JDK, CMake и т.д.
8Observer8 25.01.2026
Содержание блога
Перейдите по ссылке: https:/ / developer. android. com/ studio и в самом низу страницы кликните по архиву "commandlinetools-win-xxxxxx_latest. zip"
Извлеките архив и вы увидите. . .
|
Вывод текста со шрифтом TTF на Android с помощью библиотеки SDL3_ttf
8Observer8 25.01.2026
Содержание блога
Если у вас не установлены Android SDK, NDK, JDK, и т. д. то сделайте это по следующей инструкции: Установка Android SDK, NDK, JDK, CMake и т. д.
Сборка примера
Скачайте. . .
|
Использование SDL3-callbacks вместо функции main() на Android, Desktop и WebAssembly
8Observer8 24.01.2026
Содержание блога
Если вы откроете примеры для начинающих на официальном репозитории SDL3 в папке: examples, то вы увидите, что все примеры используют следующие четыре обязательные функции, а. . .
|