Юникод: различия между версиями

30 байт убрано ,  10 месяцев назад
отмена правки участника 85.26.168.102 (обс.)
(к удалению)
(отмена правки участника 85.26.168.102 (обс.))
Метка: отмена
'''Юнико́д'''<ref name=autogenerated1>{{cite web|url=http://www.unicode.org/standard/UnicodeTranscriptions.html|title=Unicode Transcriptions|publisher=|date=|accessdate=10 мая 2010|lang=en|archiveurl=https://web.archive.org/web/20060408204540/http://www.unicode.org/standard/UnicodeTranscriptions.html|archivedate=2006-04-08|deadlink=yes}}</ref> (чаще всего) или '''Унико́д'''<ref>[http://www.paratype.ru/help/term/terms.asp?code=361 Уникод в словаре Paratype]</ref> ({{lang-en|Unicode}}) — стандарт [[Набор символов|кодирования символов]], включающий в себя знаки почти всех письменных [[язык]]ов мира<ref name="unicode-techintro">{{cite web|url=http://www.unicode.org/standard/principles.html|title=The Unicode® Standard: A Technical Introduction|accessdate=2010-07-04|archiveurl=https://web.archive.org/web/20100310120125/http://www.unicode.org/standard/principles.html|archivedate=2010-03-10|deadlink=yes}}</ref>. В настоящее время стандарт является преобладающим в [[Интернет|Интернете]].
 
Стандарт предложен в [[1991 год|год]]у некоммерческой организацией «Консорциум Юникода» ({{lang-en|Unicode Consortium, Unicode Inc.}})<ref>{{cite web|url=http://www.unicode.org/history/publicationdates.html|title=History of Unicode Release and Publication Dates|accessdate=2010-07-04|archiveurl=https://web.archive.org/web/20100110085403/http://www.unicode.org/history/publicationdates.html|archivedate=2010-01-10|deadlink=yes}}</ref><ref>{{cite web|url=http://www.unicode.org/consortium/consort.html|title=The Unicode Consortium|accessdate=2010-07-04|archiveurl=https://web.archive.org/web/20100627085503/http://www.unicode.org/consortium/consort.html|archivedate=2010-06-27|deadlink=yes}}</ref>. Применение этого стандарта позволяет закодировать очень большое число символов из разных систем письменности: в документах, закодированных по стандарту Юникод, могут соседствовать китайские [[иероглиф]]ы, математические символы, буквы [[греческий алфавит|греческого алфавита]], [[латинский алфавит|латиницы]] и [[кириллица|кириллицы]], символы музыкальной нотной нотации, при этом становится ненужным переключение [[кодовая страница|кодовых страниц]]<ref name="unicode-foreword">{{cite web|url=http://www.unicode.org/versions/Unicode5.2.0/Foreword.pdf|title=Foreword|accessdate=2010-07-04|archiveurl=https://web.archive.org/web/20100627141434/http://www.unicode.org/versions/Unicode5.2.0/Foreword.pdf|archivedate=2010-06-27|deadlink=yes}}</ref>.
Стандарт предложен в [[1991 год|1992]]
 
[[1991 год|год]]у некоммерческой организацией «Консорциум Юникода» ({{lang-en|Unicode Consortium, Unicode Inc.}})<ref>{{cite web|url=http://www.unicode.org/history/publicationdates.html|title=History of Unicode Release and Publication Dates|accessdate=2010-07-04|archiveurl=https://web.archive.org/web/20100110085403/http://www.unicode.org/history/publicationdates.html|archivedate=2010-01-10|deadlink=yes}}</ref><ref>{{cite web|url=http://www.unicode.org/consortium/consort.html|title=The Unicode Consortium|accessdate=2010-07-04|archiveurl=https://web.archive.org/web/20100627085503/http://www.unicode.org/consortium/consort.html|archivedate=2010-06-27|deadlink=yes}}</ref>. Применение этого стандарта позволяет закодировать очень большое число символов из разных систем письменности: в документах, закодированных по стандарту Юникод, могут соседствовать китайские [[иероглиф]]ы, математические символы, буквы [[греческий алфавит|греческого алфавита]], [[латинский алфавит|латиницы]] и [[кириллица|кириллицы]], символы музыкальной нотной нотации, при этом становится ненужным переключение [[кодовая страница|кодовых страниц]]<ref name="unicode-foreword">{{cite web|url=http://www.unicode.org/versions/Unicode5.2.0/Foreword.pdf|title=Foreword|accessdate=2010-07-04|archiveurl=https://web.archive.org/web/20100627141434/http://www.unicode.org/versions/Unicode5.2.0/Foreword.pdf|archivedate=2010-06-27|deadlink=yes}}</ref>.
 
Стандарт состоит из двух основных частей: универсального набора символов ({{lang-en|Universal character set, UCS}}) и семейства кодировок ({{lang-en|Unicode transformation format, UTF}}). Универсальный набор символов перечисляет допустимые по стандарту Юникод символы и присваивает каждому символу код в виде неотрицательного целого числа, записываемого обычно в шестнадцатеричной форме с префиксом <code>U+</code>, например, <code>U+040F</code>. Семейство кодировок определяет способы преобразования кодов символов для передачи в потоке или в файле.