UTF-16: различия между версиями

[непроверенная версия][отпатрулированная версия]
Содержимое удалено Содержимое добавлено
Уточнение, что обратный порядок байт - это little endian (т.к. из текста это было не понятно)
→‎Принцип кодирования: Опечатка в слове "диапазонах", орфография
Строка 35:
 
В UTF-16 символы кодируются двухбайтовыми словами с использованием всех возможных диапазонов значений (от 0 до FFFF<sub>16</sub>).
При этом можно кодировать символы Unicode в дипазонахдиапазонах 0000<sub>16</sub>..D7FF<sub>16</sub> и E000<sub>16</sub>..10FFFF<sub>16</sub>.
Исключенный отсюда диапазон D800<sub>16</sub>..DFFF<sub>16</sub> используется как раз для кодирования так называемых суррогатных пар — символов, которые кодируются двумя 16-битными словами.