Неокогнитрон (англ. Neocognitron) — иерархическая многослойная искусственная нейронная сеть, сверточного типа, производная от когнитрона и предложенная Кунихико Фукусимой[англ.] (1980 г.), способная к робастному распознаванию образов, обычно обучаемая по принципу «обучение без учителя». Сеть данного вида также часто применяется для распознавания рукописного текста и OCR, образов с сильно искажённой или зашумлённой структурой. Прообраз сети был позаимствован из модели, предложенной Хьюбелом и Визелем (1959 г.), согласно которой, существует два вида клеток в первичной зрительной коре: простая и сложная клетка, расположенные каскадно. Неокогнитрон также состоит из каскадно соединённых нейронов S-типа (простой, англ. simple) и C-типа (сложный, англ. complex). В процессе работы сети, локальные признаки образа извлекаются при помощи клеток S-типа, а искажения признаков, такие как, например, сдвиг, — компенсируются клетками C-типа.[1] Локальные признаки на входе обобщаются поэтапно, и окончательная классификация выполняется в оконечных слоях. Подобная идея обобщения локальных признаков также применяется в сетях «LeNet» и «SIFT».

Отличия от когнитрона

править

Когнитрон и неокогнитрон имеют определенное сходство, но между ними также существуют фундаментальные различия, связанные с эволюцией исследований авторов. Оба образца являются многоуровневыми иерархическими сетями, организованными аналогично зрительной коре. В то же время неокогнитрон больше соответствует модели зрительной системы, описанной в работе Hubel D. H. и Wiesel T. N.[2] В результате неокогнитрон является намного более мощной парадигмой с точки зрения способности распознавать образы независимо от их преобразований, вращений, искажений и изменений масштаба. Как и когнитрон, неокогнитрон использует самоорганизацию в процессе обучения, хотя была описана версия[3], в которой вместо этого использовалось управляемое обучение.[4]

Методика обучения

править

Разновидности неокогнитрона

править

Существуют разные виды неокогнитронов.[5] Например, некоторые типы неокогнитронов могут обнаруживать несколько паттернов в одном и том же входе, используя обратные сигналы для достижения избирательного внимания.[6]

Примечания

править
  1. Jared Dean. Big Data, Data Mining, and Machine Learning. — Wiley, 2014. — ISBN 978-1118618042. Архивная копия от 9 сентября 2021 на Wayback Machine
  2. Hubel D. H., Wiesel T. N. Receptive fields, binocular interaction and functional architecture in the cat's visual cortex. Journal of Physiology 160:106–54. — 1962.
  3. Fukushima К., Miyake S., Takayuki I. Neocognitron: A neural network model for a mechanism of visual pattern recognition. IEEE Transaction on Systems, Man and Cybernetics SMC–13(5):826–34. — 1983.
  4. Ф. Уоссермен. Нейрокомпьютерная техника: Теория и практика. Перевод на русский язык, Ю. А. Зуев, В. А. Точенов. — 1992.
  5. Fukushima 2007
  6. Fukushima 1987, pp.81, 85

Ссылки

править