88 / 86 / 55
Регистрация: 14.11.2015
Сообщений: 1,099
1

Что такое UTF-8 BOM?

18.06.2017, 09:41. Показов 3000. Ответов 2
Метки нет (Все метки)

Много читал, но остаются вопросы.

1. BOM символ юникода и имеет кодовый символ U+FEFF. На SO пишут
In UTF-8, a BOM is encoded as the bytes EF BB BF at the beginning of the file.
Не понимаю, что значит, что этот символ закодирован как байты EF BB BF. Почему вначале файла не пишут \ufeff?

2. В другом ответе на SO, человек пишет
Once you add "EF BB BF" at the front (for example, by re-saving it using Notepad with UTF-8; or Notepad++ with UTF-8 with BOM), Excel opens it fine.
Так мы добавляем последовательность символов в начало файла, или байты?

Чувствую, что все очень просто, но не могу понять.
0
Programming
Эксперт
94731 / 64177 / 26122
Регистрация: 12.04.2006
Сообщений: 116,782
18.06.2017, 09:41
Ответы с готовыми решениями:

Изменить кодировку из utf-8 без bom в просто utf-8
формируется xls фаил в коде прописано...

Что такое монитор и что такое мьютекс? Это же разные вещи?
Здравствуйте. В разных айти-статьях по-разному используют эти термины, причём часто их путают друг...

Записать в начало файла сигнатуру BOM (EF BB BF) UTF-8 с BOM
Всем привет. Ребята подскажите как это можно сделать? Я пробовал и так QFile fal ("file"); ...

UTF-8 и BOM
Доброго времени суток. Мне нужно хранить фалы в кодировке UTF-8. НО: Если сохранять .html...

2
Эксперт Java
3638 / 2970 / 918
Регистрация: 05.07.2013
Сообщений: 14,220
18.06.2017, 10:12 2
https://ru.wikipedia.org/wiki/... 0%BE%D0%B2
0
88 / 86 / 55
Регистрация: 14.11.2015
Сообщений: 1,099
18.06.2017, 13:12  [ТС] 3
Разобрался. Если кому интересно, вот ответы.

Кодировка позволяет перевести текст Unicode'а в байты. То есть в конечном итоге наш текстовый файл будет совокупностью байтов. BOM добавляется в начало этой последовательности, например с помощью NotePad++. Далее скриншоты HeX-редактора(один и тот же файл без BOM и с ним).
Что такое UTF-8 BOM?
Что такое UTF-8 BOM?


То есть нам не в тексте порядок байтов нужно писать, нам нужно преписывать его к началу совокупности байтов, представляющих этот файл.
0
IT_Exp
Эксперт
87844 / 49110 / 22898
Регистрация: 17.06.2006
Сообщений: 92,604
18.06.2017, 13:12
Помогаю со студенческими работами здесь

Utf-8 without bom
Здравствуйте. Валидатор принял код но даёт предупреждения, что рекомендуется Utf-8 без Bom. Я...

Кодировка UTF-8 без BOM
В общем не совсем проблема, мелочь, НО бесячая мелочь! Adobe Dreamweaver СС ко всем созданным...

Кодировка UTF-8 без BOM
Никак не получаєтся сохранить php файл в колировке UTF-8. Тоисть если я сохраняю без BOM то...

Дозапись байтов UTF-8 without BOM
Добрый день. Дозаписываю байты из массива следующим образом: Stream fs = new...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
3
Ответ Создать тему
Опции темы

КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2023, CyberForum.ru