Сложность (теория информации)

Информационно-флуктуационная сложность — теоретико-информационная величина, определяемая как флуктуация информации по отношению к информационной энтропии. Она выводится из флуктуаций преобладания порядка и хаоса в динамической системе и используется в различных областях знания для измерения сложности. Теория была представлена в работе Бейтса и Шепарда в 1993 году[1].

Определение править

Информационно-флуктуационная сложность дискретной динамической системы является функцией распределения вероятностей состояний этой системы, подвергающейся случайным вводам данных. Цель управления системой с помощью богатого информационного источника, такого как генератор случайных чисел или сигнал белого шума, состоит в том, чтобы исследовать внутреннюю динамику системы почти так же, как при обработке сигналов используется импульс, богатый частотами.

Если система имеет   возможных состояний и вероятности состояний   известны, то её информационная энтропия равна

 

где   — это собственная информация о состоянии  .

Информационно-флуктуационная сложность системы определяется как стандартное отклонение или флуктуация   от её среднего значения  :

 

или

 

Флуктуация информации о состоянии   равна нулю в максимально неупорядоченной системе со всеми  ; система просто имитирует случайные вводы данных.   также равна нулю, когда система идеально упорядочена и имеет только одно фиксированное состояние  , независимо от вводов.   не равна нулю между этими двумя крайностями, когда возможны как состояния с высокой вероятностью, так и состояния с низкой вероятностью, заполняющие пространство состояний.

Флуктуации информации обеспечивают память и вычисления править

По мере развития сложной динамической системы во времени она переходит из одного состояния в другое. То, как происходят эти переходы, зависит от внешних раздражителей нерегулярным образом. В одних случаях система может быть более чувствительной к внешним раздражителям (нестабильной), а в других менее чувствительной (стабильной). Если конкретное состояние имеет несколько возможных следующих состояний, внешняя информация определяет, какое из них будет следующим, и система получает эту информацию, следуя определённой траектории в пространстве состояний. Но если несколько разных состояний ведут к одному и тому же следующему состоянию, то при входе в него система теряет информацию о том, какое состояние ему предшествовало. Таким образом, по мере своего развития во времени сложная система демонстрирует чередующиеся прирост и потерю информации. Чередования или флуктуации информации равносильны запоминанию и забыванию — временному хранению информации или памяти — это существенная особенность нетривиальных вычислений.

Получение или потеря информации, сопутствующие переходам между состояниями, могут быть связаны с собственной информацией о состоянии. Чистый информационный прирост при переходе из состояния   в состояние   — это информация, полученная при выходе из состояния  , за вычетом потери информации при входе в состояние  :

 

Здесь   — прямая условная вероятность того, что если текущим состоянием является  , то следующим состоянием будет   и   — обратная условная вероятность того, что если текущим состоянием является  , то предыдущим состоянием было  . Условные вероятности связаны с вероятностью перехода  , вероятностью того, что произойдёт переход из состояния   в состояние  , посредством :

 

Устраненив условные вероятности, получим:

 

Поэтому чистая информация, полученная системой в результате перехода, зависит только от увеличения информации о состоянии от начального до конечного состояния. Можно показать, что это верно даже для нескольких последовательных переходов[1].

Формула   напоминает связь между силой и потенциальной энергией.   подобна потенциальной энергии  , а   — силе   в формуле  . Внешняя информация «толкает» систему «вверх», в состояние с более высоким информационным потенциалом для сохранения памяти, подобно тому, как толкание тела с некоторой массой в гору, в состояние с более высоким гравитационным потенциалом, приводит к накоплению энергии. Количество накопленной энергии зависит только от конечной высоты, а не от пути в гору. Аналогично, объём хранящейся информации не зависит от пути перехода между двумя состояниями. Как только система достигает редкого состояния с высоким информационным потенциалом, она может «упасть» до обычного состояния, потеряв хранившуюся ранее информацию.

Может быть полезным вычислять стандартное отклонение   от его среднего значения (которое равно нулю), а именно флуктуацию чистого информационного прироста  [1], однако   учитывает многопереходные циклы памяти в пространстве состояний и поэтому должно быть более точным индикатором вычислительной мощности системы. Более того,   вычислить легче, поскольку переходов может быть намного больше, чем состояний.

Хаос и порядок править

Динамическая система, чувствительная к внешней информации (нестабильная), демонстрирует хаотичное поведение, тогда как система, нечувствительная к внешней информации (стабильная), демонстрирует упорядоченное поведение. Под воздействием богатого источника информации сложная система демонстрирует оба варианта поведения, колеблясь между ними в динамическом балансе. Степень флуктуации количественно измеряется с помощью  ; она фиксирует чередование преобладания хаоса и порядка в сложной системе по мере её развития во времени.

Пример: вариант элементарного клеточного автомата по правилу 110 править

Доказано, что вариант элементарного клеточного автомата по правилу 110 способен к универсальным вычислениям. Доказательство основано на существовании и взаимодействии связанных и самосохраняющихся клеточных конфигураций, известных как «планеры» или «космические корабли», явлении эмергентности, которые подразумевают способность групп клеток автомата запоминать, что планер проходит через них. Поэтому следует ожидать, что в пространстве состояний будут возникать петли памяти, в результате чередования получения и потери информации, нестабильности и стабильности, хаоса и порядка.

Рассмотрим группу из трёх смежных ячеек клеточного автомата, которые подчиняются правилу 110: конец-центр-конец. Следующее состояние центральной ячейки зависит от её текущего состояния и конечных ячеек, как указано в правиле:

Элементарное правило клеточного автомата 110
3-ячеечная группа 1-1-1 1-1-0 1-0-1 1-0-0 0-1-1 0-1-0 0-0-1 0-0-0
следующая ячейка центра 0 1 1 0 1 1 1 0

Чтобы рассчитать информационно-флуктуационную сложность этой системы, нужно прикрепить ячейку-драйвер к каждому концу группы из 3 ячеек, чтобы обеспечить случайный внешний стимул, например, драйвер→конец-центр-конец←драйвер, с тем, чтобы правило могло применяться к двум конечным ячейкам. Затем нужно определить, каково следующее состояние для каждого возможного текущего состояния и для каждой возможной комбинации содержимого ячейки-драйвера, чтобы вычислить прямые условные вероятности.

Диаграмма состояний этой системы изображена ниже. В ней кружки представляют состояния, а стрелки — переходы между состояниями. Восемь состояний этой системы, от 1-1-1 до 0-0-0 пронумерованы восьмеричными эквивалентами 3-битного содержимого группы из 3 ячеек: от 7 до 0. Возле стрелок переходов показаны значения прямых условных вероятностей. На схеме видна изменчивость в расхождении и схождении стрелок, что соответствует изменчивости в хаосе и порядке, чувствительности и нечувствительности, приобретении и потере внешней информации от ячеек-драйверов.

 
Диаграмма состояний для трёх ячеек элементарного клеточного автомата по правилу 110, показывающая прямые условные вероятности переходов при случайной стимуляции.

Прямые условные вероятности определяются пропорцией возможного содержимого ячейки-драйвера, что управляет конкретным переходом. Например, для четырёх возможных комбинаций содержимого двух ячеек-драйверов состояние 7 приводит к состояниям 5, 4, 1 и 0, поэтому  ,  ,   и   составляют ¼ или 25 %. Аналогично, состояние 0 приводит к состояниям 0, 1, 0 и 1, поэтому   и   соответствуют ½ или 50 %. И так далее.

Вероятности состояния связаны формулой

  и  

Эти линейные алгебраические уравнения могут быть решены вручную или с помощью компьютерной программы для вероятностей состояний, со следующими результатами:

Правило 110 вероятностей состояния для 3-ячеечной группы автомата со случайной стимуляцией
p0 p1 p2 p3 p4 p5 p6 p7
2/17 2/17 1/34 5/34 2/17 2/17 2/17 4/17

Информационная энтропия и сложность могут быть рассчитаны из вероятностей состояния:

  бита,
  бита.

Следует отметить, что максимально возможная энтропия для восьми состояний равна   бита, что соответствует случаю, когда все восемь состояний одинаково вероятны, с вероятностями ⅛ (хаотичность). Следовательно, правило 110 имеет относительно высокую энтропию или использование состояния в 2,86 бит. Однако, это не исключает существенную флуктуацию информации о состоянии по отношению к энтропии и, следовательно, высокую величину сложности. Тогда как максимальная энтропия исключила бы сложность.

Для получения вероятностей состояния в случае, когда аналитический метод, описанный выше, неосуществим, может быть использован альтернативный метод. Он состоит в том, чтобы управлять системой через её входы (ячейки-драйверы) с помощью случайного источника в течение многих поколений и наблюдать за вероятностями состояния эмпирически. Когда это сделано с помощью компьютерного моделирования для 10 миллионов поколений, результаты выглядят следующим образом:[2]

Информационные переменные для элементарного клеточного автомата по правилу 110
количество ячеек 3 4 5 6 7 8 9 10 11 12 13
  (бит) 2.86 3.81 4.73 5.66 6.56 7.47 8.34 9.25 10.09 10.97 11.78
 (бит) 0.56 0.65 0.72 0.73 0.79 0.81 0.89 0.90 1.00 1.01 1.15
  0.20 0.17 0.15 0.13 0.12 0.11 0.11 0.10 0.10 0.09 0.10

Поскольку оба параметра,   и  , возрастают с увеличением размера системы, для лучшего сравнения систем разных размеров предложено безразмерное соотношение  , относительная Информационно-флуктуационная сложность. Заметим, что эмпирические и аналитические результаты согласуются для 3-клеточного автомата.

В работе Бейтса и Шепарда[1]   вычисляется для всех правил элементарных клеточных автоматов, и было замечено, что те из них, которые демонстрируют медленно движущиеся «планеры» и, возможно, стационарные объекты, например, правило 110, тесно связаны с большими значениями  . Поэтому   можно использовать в качестве фильтра при выборе правил, способных к универсальному вычислению, что утомительно доказывать.

Применения править

Хотя вывод формулы информационно-флуктуационной сложности основан на флуктуациях информации в динамической системе, сама формула зависит только от вероятностей состояний и поэтому может быть также применена для любого распределения вероятностей, включая те, которые получены из статических изображений или текста.

На протяжении многих лет на оригинальную статью[1] ссылались исследователи из множества различных областей: теория сложности[3], наука о сложных системах[4], сложные сети[5], хаотическая динамика[6], запутанность для локализации многих тел[7], инженерия окружающей среды[8], экологическая сложность[9], экологический анализ временных рядов[10], устойчивость экосистем[11], загрязнение воздуха[12] и воды[13], гидрологический вейвлет анализ[14], моделирование потоков воды в почве[15], влажность почвы[16], сток в водосборах[17], глубина подземных вод[18], управление воздушным движением[19], рисунок потоков[20], наводнения[21], топология[22], экономика[23], рыночное прогнозирование цен на металлы[24] и электричество[25], информатика здоровья[26], человеческое познание[27], кинематика походки человека[28], неврология[29], анализ ЭЭГ[30], образование[31], инвестирование[32], искусственная жизнь[33], эстетика[34].

Примечания править

  1. 1 2 3 4 5 John E. Bates, Harvey K. Shepard. Measuring complexity using information fluctuation (англ.) // Physics Letters A. — 1993-01-18. — Vol. 172, iss. 6. — P. 416–425. — ISSN 0375-9601. — doi:10.1016/0375-9601(93)90232-O.
  2. Bates, John E. Measuring complexity using information fluctuation: a tutorial. Research Gate (30 марта 2020).
  3. Harald Atmanspacher. Cartesian cut, Heisenberg cut, and the concept of complexity // World Futures. — 1997-09-01. — Т. 49, вып. 3—4. — С. 333–355. — ISSN 0260-4027. — doi:10.1080/02604027.1997.9972639.
  4. Cosma Rohilla Shalizi. Methods and Techniques of Complex Systems Science: An Overview (англ.) // Complex Systems Science in Biomedicine / Thomas S. Deisboeck, J. Yasha Kresh. — Boston, MA: Springer US, 2006. — P. 33–114. — ISBN 978-0-387-33532-2. — doi:10.1007/978-0-387-33532-2_2.
  5. Huang, Min; Sun, Zhongkui; Donner, Reik V.; Zhang, Jie; Guan, Shuguang; Zou, Yong. Characterizing dynamical transitions by statistical complexity measures based on ordinal pattern transition networks (англ.) // Chaos: An Interdisciplinary Journal of Nonlinear Science : журнал. — 2021. — 9 March (vol. 31, no. 3). — doi:10.1063/5.0038876.
  6. Renate Wackerbauer. Noise-induced stabilization of the Lorenz system // Physical Review E. — 1995-11-01. — Т. 52, вып. 5. — С. 4745–4749. — doi:10.1103/PhysRevE.52.4745.
  7. Gregory A. Hamilton, Bryan K. Clark. Quantifying unitary flow efficiency and entanglement for many-body localization // Physical Review B. — 2023-02-14. — Т. 107, вып. 6. — С. 064203. — doi:10.1103/PhysRevB.107.064203.
  8. Singh, Vijay P. Entropy Theory and its Application in Environmental and Water Engineering : [англ.]. — John Wiley & Sons, 2013-01-10. — ISBN 978-1-118-42860-3.
  9. Parrott, Lael (2010-11-01). "Measuring ecological complexity". Ecological Indicators (англ.). 10 (6): 1069—1076. doi:10.1016/j.ecolind.2010.03.014. ISSN 1470-160X. Архивировано из оригинала 1 января 2012. Дата обращения: 1 мая 2020.
  10. Holger Lange. Time-series Analysis in Ecology (англ.) // eLS. — American Cancer Society, 2006. — ISBN 978-0-470-01590-2. — doi:10.1038/npg.els.0003276.
  11. Wang, Chaojun; Zhao, Hongrui (2019-04-18). "Analysis of remote sensing time-series data to foster ecosystem sustainability: use of temporal information entropy". International Journal of Remote Sensing. 40 (8): 2880—2894. doi:10.1080/01431161.2018.1533661. ISSN 0143-1161.
  12. Klemm, Otto; Lange, Holger (1999-12-01). "Trends of air pollution in the Fichtelgebirge Mountains, Bavaria". Environmental Science and Pollution Research (англ.). 6 (4): 193—199. doi:10.1007/BF02987325. ISSN 1614-7499.
  13. Wang, Kang; Lin, Zhongbing (2018). "Characterization of the nonpoint source pollution into river at different spatial scales". Water and Environment Journal (англ.). 32 (3): 453—465. doi:10.1111/wej.12345. ISSN 1747-6593.
  14. Labat, David (2005-11-25). "Recent advances in wavelet analyses: Part 1. A review of concepts". Journal of Hydrology (англ.). 314 (1): 275—288. doi:10.1016/j.jhydrol.2005.04.003. ISSN 0022-1694.
  15. Pachepsky, Yakov; Guber, Andrey; Jacques, Diederik; Simunek, Jiri; Van Genuchten, Marthinus Th.; Nicholson, Thomas; Cady, Ralph (2006-10-01). "Information content and complexity of simulated soil water fluxes". Geoderma. Fractal Geometry Applied to Soil and Related Hierarchical Systems - Fractals, Complexity and Heterogeneity (англ.). 134 (3): 253—266. doi:10.1016/j.geoderma.2006.03.003. ISSN 0016-7061.
  16. Kumar, Sujay V.; Dirmeyer, Paul A.; Peters-Lidard, Christa D.; Bindlish, Rajat; Bolten, John (2018-01-01). "Information theoretic evaluation of satellite soil moisture retrievals". Remote Sensing of Environment (англ.). 204: 392—400. doi:10.1016/j.rse.2017.10.016. hdl:2060/20180003069. ISSN 0034-4257.
  17. Hauhs, Michael; Lange, Holger (2008). "Classification of Runoff in Headwater Catchments: A Physical Problem?". Geography Compass (англ.). 2 (1): 235—254. doi:10.1111/j.1749-8198.2007.00075.x. ISSN 1749-8198.
  18. Liu, Meng; Liu, Dong; Liu, Le (2013-09-01). "Complexity research of regional groundwater depth series based on multiscale entropy: a case study of Jiangsanjiang Branch Bureau in China". Environmental Earth Sciences (англ.). 70 (1): 353—361. doi:10.1007/s12665-012-2132-y. ISSN 1866-6299.
  19. Xing, Jing; Manning, Carol A. (April 2005). "Complexity and Automation Displays of Air Traffic Control: Literature Review and Analysis" (англ.). Архивировано из оригинала 1 июня 2022. Дата обращения: 1 мая 2020. {{cite journal}}: Cite journal требует |journal= (справка)
  20. Wang, Kang; Li, Li (November 2008). "Characterizing Heterogeneous Flow Patterns Using Information Measurements". 2008 First International Conference on Intelligent Networks and Intelligent Systems: 654—657. doi:10.1109/ICINIS.2008.110.
  21. Mohamad Basel Al Sawaf, Kiyosi Kawanisi. Assessment of mountain river streamflow patterns and flood events using information and complexity measures // Journal of Hydrology. — 2020-11-01. — Т. 590. — С. 125508. — ISSN 0022-1694. — doi:10.1016/j.jhydrol.2020.125508.
  22. Javaheri Javid, Mohammad Ali; Alghamdi, Wajdi; Zimmer, Robert; al-Rifaie, Mohammad Majid (2016), Bi, Yaxin; Kapoor, Supriya; Bhatia, Rahul (eds.), "A Comparative Analysis of Detecting Symmetries in Toroidal Topology", Intelligent Systems and Applications: Extended and Selected Results from the SAI Intelligent Systems Conference (IntelliSys) 2015, Studies in Computational Intelligence (англ.), Springer International Publishing, pp. 323—344, doi:10.1007/978-3-319-33386-1_16, ISBN 978-3-319-33386-1, Дата обращения: 7 апреля 2020
  23. Javier Jurado-González, José Luis Gómez-Barroso. Economic complexity and Information Society paradigms: a hybrid contribution to explain economic growth (англ.) // Technological and Economic Development of Economy. — 2022-11-28. — Vol. 28, iss. 6. — P. 1871–1896. — ISSN 2029-4921. — doi:10.3846/tede.2022.17104. Архивировано 16 августа 2023 года.
  24. He, Kaijian; Lu, Xingjing; Zou, Yingchao; Keung Lai, Kin (2015-09-01). "Forecasting metal prices with a curvelet based multiscale methodology". Resources Policy (англ.). 45: 144—150. doi:10.1016/j.resourpol.2015.03.011. ISSN 0301-4207.
  25. He, Kaijian; Xu, Yang; Zou, Yingchao; Tang, Ling (2015-05-01). "Electricity price forecasts using a Curvelet denoising based approach". Physica A: Statistical Mechanics and its Applications (англ.). 425: 1—9. doi:10.1016/j.physa.2015.01.012. ISSN 0378-4371. Архивировано из оригинала 12 июня 2020. Дата обращения: 1 мая 2020.
  26. Mosabber Uddin Ahmed. Complexity Analysis in Health Informatics (англ.) // Signal Processing Techniques for Computational Health Informatics / Md Atiqur Rahman Ahad, Mosabber Uddin Ahmed. — Cham: Springer International Publishing, 2021. — P. 103–121. — ISBN 978-3-030-54932-9. — doi:10.1007/978-3-030-54932-9_4.
  27. Shi Xiujian; Sun Zhiqiang; Li Long; Xie Hongwei. "Human Cognitive Complexity Analysis in Transportation Systems". Logistics. Proceedings: 4361—4368. doi:10.1061/40996(330)637.
  28. Zhang, Shutao; Qian, Jinwu; Shen, Linyong; Wu, Xi; Hu, Xiaowu (October 2015). "Gait complexity and frequency content analyses of patients with Parkinson's disease". 2015 International Symposium on Bioelectronics and Bioinformatics (ISBB): 87—90. doi:10.1109/ISBB.2015.7344930.
  29. Wang, Jisung; Noh, Gyu-Jeong; Choi, Byung-Moon; Ku, Seung-Woo; Joo, Pangyu; Jung, Woo-Sung; Kim, Seunghwan; Lee, Heonsoo (2017-07-13). "Suppressed neural complexity during ketamine- and propofol-induced unconsciousness". Neuroscience Letters (англ.). 653: 320—325. doi:10.1016/j.neulet.2017.05.045. ISSN 0304-3940.
  30. Michał Bola, Paweł Orłowski, Martyna Płomecka, Artur Marchewka. EEG signal diversity during propofol sedation: an increase in sedated but responsive, a decrease in sedated and unresponsive subjects (англ.) // bioRxiv. — 2019-01-30. — P. 444281. — doi:10.1101/444281.
  31. Dilger, Alexander (2012-01-01). "Endogenous complexity, specialisation and general education". On the Horizon. 20 (1): 49—53. doi:10.1108/10748121211202062. ISSN 1074-8121.
  32. Ivanyuk, Vera Alekseevna Динамическая модель управления стратегическим инвестиционным портфелем. elibrary.ru (2015).
  33. Peña, Eric; Sayama, Hiroki. Life Worth Mentioning: Complexity in Life-Like Cellular Automata (англ.) // Artificial Life : журнал. — 2021. — 2 May (vol. 27, no. 2). — doi:10.1162/artl_a_00348. Архивировано 16 августа 2023 года.
  34. Mohammad Ali Javaheri Javid. Aesthetic Automata: Synthesis and Simulation of Aesthetic Behaviour in Cellular Automata. — Goldsmiths, University of London, 2019-11-30. Архивировано 16 августа 2023 года.