Юникод: различия между версиями

143 байта добавлено ,  1 год назад
→‎Кодовое пространство: викификация; дополнение; исправление; обновление
(→‎Версии Юникода: викификация; дополнение; уточнение; стилевые правки)
(→‎Кодовое пространство: викификация; дополнение; исправление; обновление)
 
== Кодовое пространство ==
Хотя формы записи UTF-8 и UTF-32 позволяют кодировать до 2<sup>31</sup> ({{formatnum:2147483648}}) кодовых позиций, было принято решение использовать лишь {{formatnum:1112064}} для совместимости с UTF-16. Впрочем, даже и этого нав текущийданный момент более чем достаточно — в версии 12.01 используется всего {{formatnum:137928137994}} кодовых позиций.
 
Кодовое пространство разбито на 17 ''[[Плоскость (Юникод)|плоскостей]]'' ({{lang-en|planes}}) по 2<sup>16</sup> ({{formatnum:65536}}) символов. Нулевая плоскость ({{lang-en2|plane{{nbsp}}0}}) называется ''базовой'' ({{lang-en2|basic}}) и содержит символы наиболее употребительных письменностей. Остальные плоскости — дополнительные ({{lang-en2|supplementary}}). Первая плоскость ({{lang-en2|plane{{nbsp}}1}}) используется в основном для исторических письменностей, вторая ({{lang-en2|plane{{nbsp}}2}}) — для редко используемых иероглифов [[CJK|китайского письма (ККЯ)]], третья ({{lang-en2|plane{{nbsp}}3}}) зарезервирована для архаичных китайских иероглифов<ref>[http://unicode.org/roadmaps/tip/ Roadmap to the TIP (Tertiary Ideographic Plane)]</ref>. Плоскость 14 отведена для символов, используемых по особому назначению. Плоскости 15 и 16 выделены для частного употребления<ref name='unicode-02' />.
 
Для обозначения символов Unicode используется запись вида «U+''xxxx''» (для кодов 0…FFFF), или «U+''xxxxx''» (для кодов 10000…FFFFF), или «U+''xxxxxx''» (для кодов 100000…10FFFF), где ''xxx'' — [[шестнадцатеричная система счисления|шестнадцатеричные]] цифры. Например, символ «я» (U+044F) имеет код 044F{{sub|16}}{{nbsp}}= 1103{{sub|[[десятичная система счисления|10]]}}.
! Плоскость !! Название !! Диапазон символов
|-
| 0 || Базовая многоязыковая плоскость ({{lang-en2|Basic multilingual plane, BMP}}) || U+0000…U+​FFFFFFFF
|-
| 1 || Дополнительная многоязыковая плоскость ({{lang-en2|Supplementary multilingual plane, SMP}}) || U+10000…U+​1FFFF1FFFF
|-
| 2 || Дополнительная иероглифическая плоскость ({{lang-en2|Supplementary ideographic plane, SIP}}) || U+20000…U+​2FFFF2FFFF
|-
| 3 || Третичная иероглифическая плоскость ({{lang-en2|Tertiary ideographic plane, TIP}}) || U+30000…U+3FFFF
|-
| 4—13 || не используются || U+40000…U+​DFFFFDFFFF
|-
| 14 || Дополнительная плоскость особого назначения ({{lang-en2|Supplement­arySupplementary special-purpose plane, SSP}}) || U+E0000…U+​EFFFFEFFFF
|-
| 15—16 || Дополнительные области для частного использования ({{lang-en2|Supplement­arySupplementary private use area, SPUA-A/B}}) || U+F0000…U+​10FFFF10FFFF
|-
|}