UTF-7: различия между версиями

[непроверенная версия][непроверенная версия]
Содержимое удалено Содержимое добавлено
Строка 84:
Маркер Юникода (часто называемый «BOM» — byte-order mark) является необязательной специальной последовательностью байтов в самом начале потока или файла, который, не будучи самими данными, указывает кодировку, используемую для последующих данных; маркер используется при отсутствии метаданных, обозначающих кодировку. Для данной схемы кодирования сигнатура представляет собой представление схемы в кодовой точке Unicode U+FEFF, так называемый BOM-символ.
 
Хотя сигнатура Unicode, как правило, представляет собой единую фиксированную последовательность байтов, специфика UTF-7 представляет 5 вариаций: последние 2 бита 4-го байта кодировки UTF-7 U+FEFF относятся к следующему символу, что приводит к 4 возможным битовым шаблонам и, следовательно, 4 разным возможным байтам в 4-й позиции. Пятая вариация необходима для устранения неоднозначности случая, когда никакие символы вообще не следуют за подписью. См. Запись[[Маркер UTF-7последовательности вбайтов|Определение таблицекодировки подписипо Unicodeмаркеру последовательности байтов]].
 
== Безопасность ==