Неокогнитрон

Неокогнитрон (англ. Neocognitron) — иерархическая многослойная искусственная нейронная сеть, сверточного типа, производная от когнитрона и предложенная Кунихико Фукусимой^[англ.] (1980 г.), способная к робастному распознаванию образов, обычно обучаемая по принципу «обучение без учителя». Сеть данного вида также часто применяется для распознавания рукописного текста и OCR, образов с сильно искажённой или зашумлённой структурой. Прообраз сети был позаимствован из модели, предложенной Хьюбелом и Визелем (1959 г.), согласно которой, существует два вида клеток в первичной зрительной коре: простая и сложная клетка, расположенные каскадно. Неокогнитрон также состоит из каскадно соединённых нейронов S-типа (простой, англ. simple) и C-типа (сложный, англ. complex). В процессе работы сети, локальные признаки образа извлекаются при помощи клеток S-типа, а искажения признаков, такие как, например, сдвиг, — компенсируются клетками C-типа.^[1] Локальные признаки на входе обобщаются поэтапно, и окончательная классификация выполняется в оконечных слоях. Подобная идея обобщения локальных признаков также применяется в сетях «LeNet» и «SIFT».

Отличия от когнитрона

Когнитрон и неокогнитрон имеют определенное сходство, но между ними также существуют фундаментальные различия, связанные с эволюцией исследований авторов. Оба образца являются многоуровневыми иерархическими сетями, организованными аналогично зрительной коре. В то же время неокогнитрон больше соответствует модели зрительной системы, описанной в работе Hubel D. H. и Wiesel T. N.^[2] В результате неокогнитрон является намного более мощной парадигмой с точки зрения способности распознавать образы независимо от их преобразований, вращений, искажений и изменений масштаба. Как и когнитрон, неокогнитрон использует самоорганизацию в процессе обучения, хотя была описана версия^[3], в которой вместо этого использовалось управляемое обучение.^[4]

Методика обучения

Разновидности неокогнитрона

Существуют разные виды неокогнитронов.^[5] Например, некоторые типы неокогнитронов могут обнаруживать несколько паттернов в одном и том же входе, используя обратные сигналы для достижения избирательного внимания.^[6]

Примечания

↑ Jared Dean. Big Data, Data Mining, and Machine Learning. — Wiley, 2014. — ISBN 978-1118618042. Архивная копия от 9 сентября 2021 на Wayback Machine
↑ Hubel D. H., Wiesel T. N. Receptive fields, binocular interaction and functional architecture in the cat's visual cortex. Journal of Physiology 160:106–54. — 1962.
↑ Fukushima К., Miyake S., Takayuki I. Neocognitron: A neural network model for a mechanism of visual pattern recognition. IEEE Transaction on Systems, Man and Cybernetics SMC–13(5):826–34. — 1983.
↑ Ф. Уоссермен. Нейрокомпьютерная техника: Теория и практика. Перевод на русский язык, Ю. А. Зуев, В. А. Точенов. — 1992.
↑ Fukushima 2007
↑ Fukushima 1987, pp.81, 85

Ссылки

Программная реализация неокогнитрона на C# Архивная копия от 7 февраля 2011 на Wayback Machine
Программная реализация неокогнитрона на Delphi 6 Архивная копия от 20 ноября 2012 на Wayback Machine

[1] Jared Dean. Big Data, Data Mining, and Machine Learning. — Wiley, 2014. — ISBN 978-1118618042. Архивная копия от 9 сентября 2021 на Wayback Machine

[2] Hubel D. H., Wiesel T. N. Receptive fields, binocular interaction and functional architecture in the cat's visual cortex. Journal of Physiology 160:106–54. — 1962.

[3] Fukushima К., Miyake S., Takayuki I. Neocognitron: A neural network model for a mechanism of visual pattern recognition. IEEE Transaction on Systems, Man and Cybernetics SMC–13(5):826–34. — 1983.

[4] Ф. Уоссермен. Нейрокомпьютерная техника: Теория и практика. Перевод на русский язык, Ю. А. Зуев, В. А. Точенов. — 1992.

[5] Fukushima 2007

[6] Fukushima 1987, pp.81, 85

[1]

[2]

[3]

[4]

[5]

[6]