Теоремы Шеннона для источника общего вида
Теоремы Шеннона для источника общего вида описывают возможности кодирования источника общего вида с помощью разделимых кодов. Другими словами, описываются максимально достижимые возможности кодирования без потерь.
Прямая теорема
правитьВ применении к побуквенному кодированию прямая теорема может быть сформулирована следующим образом:
Существует префиксный, то есть разделимый код, для которого средняя длина сообщений отличается от нормированной энтропии не более, чем на единицу:
где:
- — некоторый источник сообщений, а также множество всех его сообщений
- — длины сообщений источника после кодирования
- — средняя длина сообщений
- — энтропия источника
- — количество букв в алфавите кодирования (например, 2 для двоичного алфавита, 33 — для кодирования заглавными русскими буквами и т. д.)
В качестве доказательства теоремы исследуются характеристики кода Шеннона-Фано. Данный код удовлетворяет условиям теоремы, и он обладает указанными свойствами.
Обратная теорема
правитьОбратная теорема ограничивает максимальную степень сжатия, достигаемую с помощью кодирования без потерь. В применении к побуквенному кодированию, описывает ограничение на среднюю длину кодового слова для любого разделимого кода.
Для любого разделимого кода с длинами средняя длина сообщений больше или равна энтропии источника , нормированный на двоичный логарифм от числа букв в алфавите кодера:
Литература
править- Габидулин Э. М., Пилипчук Н. И. §3.4 Теоремы Шеннона для источника // Лекции по теории информации — МФТИ, 2007. — С. 49—52. — 214 с. — ISBN 978-5-7417-0197-3