Форум программистов, компьютерный форум, киберфорум
PHP для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.73/15: Рейтинг темы: голосов - 15, средняя оценка - 4.73
 Аватар для w3lifer
1 / 1 / 0
Регистрация: 31.03.2014
Сообщений: 78

Unicode и UTF-8

28.09.2014, 19:50. Показов 2921. Ответов 3
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Всем Доброго!
Объясните пожалуйста, что такое Unicode и UTF-8.
Не нужно только давать ссылки на поисковые системы и на консорциум - не пять лет .
Везде отвечают "шаблоном wiki", а это говорит о том, что человек либо не знает о чем говорит, либо сам толком не разобрался.

Как я понимаю на данный момент:

Unicode (как стандарт) - представление символов, в котором каждому символу присвоен свой номер в таблице ...
Unicode (как кодировка) - один из способов преобразования символов Unicode в машинный код.
UTF-8 - один (более универсальный) из способов преобразования символов Unicode в машинный код.

Объясните "на пальцах", без "заумных" слов, желательно с примером. Спасибо.
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
28.09.2014, 19:50
Ответы с готовыми решениями:

Непонятная кодировка, Unicode, UTF-8
Никак не могу решить проблему, уже 2 дня с ней вожусь. 1С веб-сервис через SOAP посылает строчку "Штрафы и премии" на вебхук php,...

Php unicode
Всем добрый день! Возникла след. проблема: Год назад я написал тел.справочник на PHP, база MS SQL 2000, данные в таблице хранятся в...

Сменить кодировку строки на Unicode
Ребят, подскажите, каким образом это делается? $str = "asdfasdf"; Как ее в unicode преобразовать?

3
Ушел с форума
Эксперт С++
 Аватар для Убежденный
16481 / 7444 / 1187
Регистрация: 02.05.2013
Сообщений: 11,616
Записей в блоге: 1
28.09.2014, 20:54
Unicode - это стандарт кодирования символов самых разных языков мира.
Для каждой буквы, символа или какого-то специального знака в Unicode
определена соответствующая позиция, называется она "кодовая точка".
Например, кириллической букве "Ф" соответствует кодовая точка U+0424.

Но сам Unicode не определяет, как именно должен храниться текст.
Проще говоря, не определяет, как записать кодовую точку U+0424 в набор байт.
Для этого и существуют UTF-8, UTF-16, UTF-32 и т.п. Например, в UTF-32 каждому
символу отводится 4 байта, причем существуют еще вариации с разным
порядком байт - Big Endian (старший байт идет вначале, затем младший) и
Little Endian (сначала младший байт, после него старший), из-за чего, к примеру,
UTF-16 бывает двух видов: UTF-16LE и UTF-16BE.

Конкретно в UTF-8 принята такая схема: коды латинских символов, а
также стандартные символы типа пробела, кавычек и т.п., занимают 1 байт и
соответствуют кодам ASCII. Размер других символов занимает от 2 до 6 байт и
формируется с помощью специального префикса (в Википедии есть пример).

В общем, Unicode - это стандарт кодирования, а UTF-8 - один из способов
хранения/представления юникодных символов.
1
 Аватар для w3lifer
1 / 1 / 0
Регистрация: 31.03.2014
Сообщений: 78
28.09.2014, 21:59  [ТС]
Убежденный, спасибо за разъяснение.
P. S. Пост, который подтверждает Ваш ответ на мой вопрос и который внес ясность в мое недопонимание: http://www.rrn.dk/the-differen... nd-unicode .
0
 Аватар для w3lifer
1 / 1 / 0
Регистрация: 31.03.2014
Сообщений: 78
13.12.2014, 22:32  [ТС]
Мой перевод указанной выше статьи: Чем отличаются UTF-8 и Unicode?.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
13.12.2014, 22:32
Помогаю со студенческими работами здесь

GET запрос возвращает unicode символы
Я использую cURL, и после отправки get запроса я получаю следующий html код: $rezult =...

Получение кода символа в unicode
Есть специальная функция? Загоняешь "п", получаешь "1087". Желательно из коробки, ибо прописывать для каждого символа свой код - долго, и...

Получение символа из кода unicode
Помогите найти такую функцию. Пихаешь "1087", получаешь "п"

Убрать лишние символы из unicode строки
Доброго времени суток! столкнулся с такой ерундой: получаю сессионную переменную $_SESSION (берётся из скрипта, который возвращает имя...

base64_encode для символов Unicode из MSSQL
Добрый день! Существует база MSSQL. Из неё скриптом вытягиваются данные. Строка типа: Необходимо сделать base64_encode ТОЛЬКО...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
4
Ответ Создать тему
Новые блоги и статьи
Инструменты COM: Сохранение данный из VARIANT в файл и загрузка из файла в VARIANT
bedvit 28.01.2026
Сохранение базовых типов COM и массивов (одномерных или двухмерных) любой вложенности (деревья) в файл, с возможностью выбора алгоритмов сжатия и шифрования. Часть библиотеки BedvitCOM Использованы. . .
Загрузка PNG с альфа-каналом на SDL3 для Android: с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 28.01.2026
Содержание блога SDL3 имеет собственные средства для загрузки и отображения PNG-файлов с альфа-каналом и базовой работы с ними. В этой инструкции используется функция SDL_LoadPNG(), которая. . .
Загрузка PNG с альфа-каналом на SDL3 для Android: с помощью SDL3_image
8Observer8 27.01.2026
Содержание блога SDL3_image - это библиотека для загрузки и работы с изображениями. Эта пошаговая инструкция покажет, как загрузить и вывести на экран смартфона картинку с альфа-каналом, то есть с. . .
влияние грибов на сукцессию
anaschu 26.01.2026
Бифуркационные изменения массы гриба происходят тогда, когда мы уменьшаем массу компоста в 10 раз, а скорость прироста биомассы уменьшаем в три раза. Скорость прироста биомассы может уменьшаться за. . .
Воспроизведение звукового файла с помощью SDL3_mixer при касании экрана Android
8Observer8 26.01.2026
Содержание блога SDL3_mixer - это библиотека я для воспроизведения аудио. В отличие от инструкции по добавлению текста код по проигрыванию звука уже содержится в шаблоне примера. Нужно только. . .
Установка Android SDK, NDK, JDK, CMake и т.д.
8Observer8 25.01.2026
Содержание блога Перейдите по ссылке: https:/ / developer. android. com/ studio и в самом низу страницы кликните по архиву "commandlinetools-win-xxxxxx_latest. zip" Извлеките архив и вы увидите. . .
Вывод текста со шрифтом TTF на Android с помощью библиотеки SDL3_ttf
8Observer8 25.01.2026
Содержание блога Если у вас не установлены Android SDK, NDK, JDK, и т. д. то сделайте это по следующей инструкции: Установка Android SDK, NDK, JDK, CMake и т. д. Сборка примера Скачайте. . .
Использование SDL3-callbacks вместо функции main() на Android, Desktop и WebAssembly
8Observer8 24.01.2026
Содержание блога Если вы откроете примеры для начинающих на официальном репозитории SDL3 в папке: examples, то вы увидите, что все примеры используют следующие четыре обязательные функции, а. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru