Юникод: различия между версиями

Нет изменений в размере ,  2 года назад
(→‎UTF-8: ASCII 8 битная, а не 7ми)
=== UTF-8 ===
{{Основная статья|UTF-8}}
UTF-8 — представление Юникода, обеспечивающее наибольшую компактность и обратную совместимость с 87-битной системой [[ASCII]]; текст, состоящий только из символов с номерами меньше 128, при записи в UTF-8 превращается в обычный текст [[ASCII]] и может быть отображён любой программой, работающей с ASCII; и наоборот, текст, закодированный 7-битной ASCII может быть отображён программой, предназначенной для работы с UTF-8. Остальные символы Юникода изображаются последовательностями длиной от 2 до 4 байт, в которых первый байт всегда имеет маску <code>11xxxxxx</code>, а остальные — <code>10xxxxxx</code>. В UTF-8 не используются суррогатные пары.
 
Формат UTF-8 был изобретён [[2 сентября]] [[1992 год]]а [[Томпсон, Кен|Кеном Томпсоном]] и [[Пайк, Роб|Робом Пайком]] и реализован в [[Plan{{nbsp}}9|Plan 9]]<ref>http://www.cl.cam.ac.uk/~mgk25/ucs/utf-8-history.txt{{ref-en}}</ref>. Сейчас стандарт UTF-8 официально закреплён в документах RFC 3629 и ISO/IEC 10646 Annex D.
Анонимный участник