Нейроуправление

Нейроуправление (англ. Neurocontrol) — частный случай интеллектуального управления, использующий искусственные нейронные сети для решения задач управления динамическими объектами. Нейроуправление находится на стыке таких дисциплин, как искусственный интеллект, нейрофизиология, теория автоматического управления, робототехника. Нейронные сети обладают рядом уникальных свойств, которые делают их мощным инструментом для создания систем управления: способностью к обучению на примерах и обобщению данных, способностью адаптироваться к изменению свойств объекта управления и внешней среды, пригодностью для синтеза нелинейных регуляторов, высокой устойчивость к повреждениям своих элементов в силу изначально заложенного в нейросетевую архитектуру параллелизма. Термин «нейроуправление» впервые был использован одним из авторов метода обратного распространения ошибки Полом Дж. Вербосом в 1976 году^[1]^[2]. Известны многочисленные примеры практического применения нейронных сетей для решения задач управление самолётом^[3]^[4], вертолётом^[5], автомобилем-роботом^[6], скоростью вращения вала двигателя^[7], гибридным двигателем автомобиля^[8], электропечью^[9], турбогенератором^[10], сварочным аппаратом^[11], пневмоцилиндром^[12], системой управления вооружением легкобронированных машин^[13], моделью перевернутого маятника^[14].

Методы нейроуправления править

Схема прямого нейроуправления с обратной связью. На такте k нейроконтроллер получает на вход уставочное значение r(k+1) и оценку текущего состояния объекта S(k) и генерирует управляющее воздействие u(k), переводя объект управления в новое положение y(k+1).

По способу использования нейронных сетей методы нейроуправления делятся на прямые и непрямые. В прямых методах нейронная сеть обучается непосредственно генерировать управляющие воздействия на объект, в непрямых методах нейронная сеть обучается выполнять вспомогательные функции: идентификация объекта управления, подавление шума, оперативная настройка коэффициентов ПИД-контроллера. В зависимости от числа нейросетей, составляющих нейроконтроллер, системы нейроуправления делятся на одномодульные и многомодульные. Системы нейроуправления, которые применяются совместно с традиционными регуляторами, называются гибридными.

В области управления искусственные нейронные системы (ИНС) находят применение в задачах идентификации объектов, в алгоритмах прогнозирования и диагностики, а также для синтеза оптимальных Автоматических Систем Регулирования (АСР). Для реализации АСР на основе ИНС в настоящее время интенсивно развивается производство нейрочипов и нейроконтроллеров (НК).

В определённом смысле ИНС является имитатором мозга, обладающего способностью к обучению и ориентации в условиях неопределенности. Искусственная нейросеть сходна с мозгом в двух аспектах. Сеть приобретает знания в процессе обучения, а для сохранения знаний использует не сами объекты, а их связи — значения коэффициентов межнейронных связей, называемые синаптическими весами или синаптическими коэффициентами^[15].

В задачах нейроуправления для представления объекта управления используют модель чёрного ящика, в котором наблюдаемыми являются текущие значения входа и выхода. Состояние объекта считается недоступным для внешнего наблюдения, хотя размерность вектора состояний обычно считается фиксированной. Динамику поведения объекта управления можно представить в дискретном виде:

{\begin{matrix}S(k+1)=\Phi (S(k),u(k)))\\y(k+1)=\Psi (S(k))\end{matrix}}

где: $S(k)\in \mathbb {R} ^{N}$ — состояние объекта управления порядка $N$ на такте $k$ ; $u(k)\in \mathbb {R} ^{P}$ — значение $P$ -мерного вектора управления на такте $k$ , $y(k+1)\in \mathbb {R} ^{V}$ — значение $V$ -мерного выхода объекта управления на такте $k+1$ .

Для оценки текущего состояния объекта управления $S(k)$ может быть использована модель NARX, состоящая из прошлых положений объекта $y$ и задержанных сигналов управления $u$ :

S(k)=[y(k)~y(k-1)~y(k-2)~\ldots ~y(k-N)~u(k-1)~u(k-2)~\ldots ~u(k-Q)]^{T}

Вектор оценки состояния $S$ может быть также представлен без использования задержанных сигналов:

S(k)=[y(k)~y(k-1)~y(k-2)~\ldots ~y(k-N)]^{T}

Также возможно представить состояние объекта как мгновенный снимок его фазовой траектории:

S(k)=[y(k)~y(k)'~\ldots ~y(k)^{(N)}]^{T}

Подражающее нейроуправление править

Схема подражающего нейроуправления: слева — режим обучения нейронной сети; справа — режим управления

Подражающее нейроуправление^[16]^[17]^[18] (Neurocontrol learning based on mimic, controller modeling, supervised learning using an existing controller) охватывает системы нейроуправления, в которых нейроконтроллер обучается на примерах динамики обычного контроллера по обратной связи, построенного, например, на основе обычной ПИД-схемы управления. После обучения нейронная сеть в точности воспроизводит функции исходного контроллера. В качестве примеров динамики контроллера может быть использована запись поведения человека-оператора. Обычный контроллер по обратной связи (или человек-оператор) управляет объектом управления в штатном режиме. Значения величин на входе и выходе контроллера протоколируются, и на основе протокола формируется обучающая выборка $U=\{P_{i},T_{i}\}_{i=1}^{M}$ для нейронной сети, содержащая $M$ пар значений входа $P_{i}$ и ожидаемых реакций $T_{i}$ нейросети:

{\begin{matrix}P_{i}=[r(i+1)~S(i)]^{T}\\T_{i}=u(i)\end{matrix}}

После обучения с помощью, например, метода обратного распространения ошибки, нейронная сеть подключается вместо исходного контроллера. Полученный нейроконтроллер может заменить человека в управлении устройством, а также быть более выгодным экономически, чем исходный контроллер.

Обобщённое инверсное нейроуправление править

Схема обобщённого инверсного нейроуправления: слева — режим обучения инверсного нейроэмулятора; справа — режим управления объектом

В схеме обобщённого инверсного нейроуправления (generalized inverse neurocontrol, direct inverse neurocontrol, adaptive inverse control)^[19]^[20] в качестве контроллера используется нейронная модель инверсной динамики объекта управления, называемая инверсный нейроэмулятор. Инверсный нейроэмулятор представляет собой нейронную сеть, обученную в режиме офлайн имитировать обратную динамику объекта управления на основе записанных траекторий поведения динамического объекта. Для получения таких траекторий на объект управления в качестве управляющего сигнала подают некоторый случайный процесс. Значения управляющих сигналов и ответных реакций объекта протоколируют и на этой основе формируют обучающую выборку $U=\{P_{i},T_{i}\}_{i=1}^{M}$ :

{\begin{matrix}P_{i}=[y(i)~S(i-1)]^{T}\\T_{i}=u(i)\end{matrix}}

В ходе обучения нейронная сеть должна уловить и запомнить зависимость значений управляющего сигнала $u(k-1)$ от последующего значения реакции объекта управления $y(k)$ , находящегося перед этим в состоянии $S(k-1)$ . При управлении объектом инверсный нейроэмулятор подключается как контроллер, получая при этом на вход $x(k)$ значения уставки (некоторой величины или параметра, по достижении которого происходит изменение состояния системы) $r(k+1)$ и состояния объекта управления $S(k)$ , поступающего по каналу обратной связи:

x(k)=[r(k+1)~S(k)]^{T}

Предполагается, что сформированная при обучении инверсная модель объекта управления является адекватной, следовательно, сигнал управления, выдаваемый нейронной сетью, обеспечит переход объекта в положение, заданное уставкой.

Специализированное инверсное нейроуправление править

Специализированное инверсное нейроуправление (specialised inverse neurocontrol)^[19]^[20] использует методику обучения нейроконтроллера в режиме онлайн, используя текущую ошибку отклонения положения объекта от уставки $e(k)=r(k)-y(k)$ . Схема подключения нейроконтроллера такая же, как в методе обобщённого инверсного нейроуправления. На вход сети подается вектор $x(k)$ :

x(k)=[r(k+1)~S(k)]^{T}

Нейронная сеть генерирует управляющий вектор $u(k)$ , который переводит объект управления в положение $y(k+1)$ . Далее вычисляется текущая ошибка работы нейроконтроллера

e(k)=r(k+1)-y(k+1)

Вычисляется градиент изменения весов

\Delta w=e(k){\frac {\partial y(k+1)}{\partial u(k)}}{\frac {\partial u(k)}{\partial w(k)}}

Затем производится коррекция весов нейроконтроллера по методу наискорейшего спуска или каким-либо другим градиентным методом.

Производная ${\frac {\partial y(k+1)}{\partial u(k)}}$ представляет собой якобиан объекта управления, значение которого задается аналитически по заданной математической модели объекта управления. Однако, на практике, для получения приемлемого качества управления часто бывает достаточно вычислить лишь знак якобиана. Итерации коррекции значений коэффициентов продолжаются до достижения приемлемого качества управления.

Метод обратного пропуска ошибки через прямой нейроэмулятор править

Метод обратного пропуска ошибки через прямой нейроэмулятор: слева — схема обучения прямого нейроэмулятора; справа — схема обучения нейроконтроллера

Метод обратного пропуска ошибки через прямой нейроэмулятор (backpropagation through time, model reference adaptive control, internal model control)^[8]^[21]^[22]^[23] основан на идее применения тандема из двух нейронных сетей, одна из которых выполняет функцию контроллера, а вторая — модели объекта управления, которая носит название прямой нейроэмулятор. Прямой нейроэмулятор служит для вычисления градиента ошибки нейроконтроллера в процессе его обучения и далее не используется. Можно сказать, что нейроконтроллер и нейроэмулятор представляют собой единую нейросеть, при этом при обучении нейроконтроллера веса прямого нейроэмулятора «замораживаются». Прямой нейроэмулятор обучается первым. Для этого на вход объекта управления подаётся случайный управляющий сигнал $u$ , изменяющий положение объекта управления $y$ , и формируется обучающая выборка $U=\{P_{i},T_{i}\}_{i=1}^{M}$ :

{\begin{matrix}P_{i}=[u(i)~S(i-1)]^{T}\\T_{i}=y(i)\end{matrix}}

Обучение прямого нейроэмулятора выполняется в режиме офлайн. Прямой нейроэмулятор считается обученным, если при одинаковых значениях на входах нейроэмулятора и реального объекта отличие между значениями их выходов становится незначительным. После завершения обучения прямого нейроэмулятора проводится обучение нейроконтроллера. Обучение выполняется в режиме онлайн по такой же схеме, как и в случае специализированного инверсного нейроуправления. Сначала (на такте $k$ ) на вход нейроконтроллера поступает желаемое положение объекта управления для следующего такта $r(k+1)$ . Нейроконтроллер генерирует сигнал управления $u(k)$ , который поступает на входы объекта управления и нейроэмулятора. В результате управляемый объект переходит в положение $y(k+1)$ , а нейроэмулятор генерирует реакцию ${\hat {y}}(k+1)$ . Далее вычисляется ошибка управления $e(k)={\widehat {y}}(k+1)-y(k+1)$ и пропускается в обратном направлении по правилу обратного распространения. Весовые коэффициенты связей нейроэмулятора при этом не корректируются. Механизм обратного прохождения ошибки через прямой нейроэмулятор реализует локальную инверсную модель в текущей точке пространства состояний объекта управления. Пройдя через нейроэмулятор, ошибка далее распространяется через нейроконтроллер, но теперь её прохождение сопровождается коррекцией весовых коэффициентов нейроконтроллера. Прямой нейроэмулятор при этом выполняет функции дополнительных слоев нейроной сети нейроконтроллера, в которых веса связей не корректируются.

Метод нейроуправления с эталонной моделью править

Нейроуправление с эталонной моделью

Метод нейроуправления с эталонной моделью (model reference adaptive control, neural adaptive control)^[23]^[24]^[25] — вариант нейроуправления по методу обратного пропуска ошибки через прямой нейроэмулятор с дополнительно внедрённой в схему эталонной моделью (reference model) динамической системы, имитировать поведение которой обучается нейроконтроллер. Это делается в целях повышения качества переходного процесса: в случае, когда переход объекта в целевое положение за один такт невозможен, траектория движения и время осуществления переходного процесса становятся плохо прогнозируемыми величинами и могут привести к неустойчивости переходного процесса. Для уменьшения этой неопределенности вводится эталонная модель, представляющая собой, как правило, устойчивую линейную динамическую систему первого или второго порядка. В ходе обучения эталонная модель на такте $k$ получает на вход уставку $r(k+1)$ и генерирует опорную траекторию $y'(k+1)$ , которая сравнивается с положением объекта управления $y(k+1)$ с целью получить ошибку управления $e(k+1)$ , минимизировать которую обучается нейроконтроллер.

Метод нейросетевой фильтрации внешних возмущений править

Схема метода нейросетевой фильтрации внешних возмущений

Метод нейросетевой фильтрации внешних возмущений (adaptive inverse control based on linear and nonlinear adaptive filtering, internal model control)^[26] служит для улучшения качества работы контроллера в цепи управления. Изначально эта схема была предложена Б. Уидроу для использования совместно с нейроконтроллерами, обученными по методу обобщенного инверсного нейроуправления^[27]. В более поздней работе^[28] им были применены нейроконтроллеры, обученные по методу обратного распространения ошибки через прямой нейроэмулятор. В принципе, нейросетевую фильтрацию ошибок можно использовать для повышения качества работы контроллера любого типа, не обязательно нейросетевого. В этой схеме используется две предварительно обученных нейронных сети: инверсный нейроэмулятор, обученный так же, как это делается в методе обобщенного инверсного нейроуправления и прямой нейроэмулятор, обученный так же, как это делается в методе обратного распространения ошибки через прямой нейроэмулятор. Пусть на объект управления поступает управляющий сигнал ${\hat {u}}_{F}(k)$ , явившийся результатом суммирования сигнала контроллера ${\hat {u}}(k)$ и корректирующего сигнала системы фильтрации внешних возмущений ${\hat {u}}_{C}(k)$ , вычисленного на предыдущем такте. Сигнал направляется на прямой нейроэмулятор объекта управления, а реакция прямого нейроэмулятора сравнивается с реальным положением системы $y(k)$ . Разница этих величин $e(k)$ трактуется как нежелательное отклонение системы, вызванное внешним возмущением. Для подавления нежелательного эффекта сигнал поступает на инверсный нейроэмулятор, который рассчитывает корректирующий сигнал ${\hat {u}}_{C}(k+1)$ для корректировки управляющего сигнала нейроконтроллера ${\hat {u}}(k+1)$ на следующем такте.

Для использования этого метода объект управления должен обладать обращаемой динамикой, а также необходимо иметь адекватную математическую или имитационную модель объекта управления для обучения прямого и инверсного нейроэмуляторов.

Прогнозирующее модельное нейроуправление править

Схема прогнозирующего модельного нейроуправления

Прогнозирующее модельное нейроуправление (NN predictive control, model predictive control, neural generalized predictive control)^[29]^[30] минимизирует функционал стоимости интегральной ошибки $Q(k)$ , прогнозируемой на $L=max(L_{2},L_{3})$ , $0\leq L_{1}\leq L_{2}$ тактов вперед:

$Q(k)=\sum _{i=L_{1}}^{L_{2}}e(k+i)^{2}+\rho \sum _{i=0}^{L_{3}}(u(k+i)-u(k+i-1))^{2}.$

Здесь $e(k)$ — ошибка выхода системы, $\rho$ — вклад изменения управляющего сигнала в общий функционал стоимости $Q(k)$ . Для прогнозирования будущего поведения системы и вычисления ошибок используется прямой нейроэмулятор, обученный так же, как в методе обратного распространения ошибки через прямой нейроэмулятор. Примечательность рассматриваемого метода состоит в том, что в нём отсутствует обучаемый нейроконтроллер. Его место занимает оптимизационный модуль, работающий в режиме реального времени, в котором может быть использован, например, симплекс-метод^[31] или квази-Ньютоновский алгоритм^[32].

Оптимизационный модуль получает на такте целевую траекторию на $L$ тактов вперед, а если её нет, то $L$ раз дублирует значение текущей уставки $r(k+1)$ и использует это в качестве целевой траектории. Далее, для выбора оптимального управляющего воздействия, вычисления происходят во внутреннем цикле системы нейроуправления (его итерации обозначаются как $j$ ). За время одного такта управления оптимизационный модуль подаёт на вход нейроэмулятора серию различных воздействий ${\hat {u}}(k+t,j)$ , где $t$ — глубина прогнозирования, $0\leq t\leq L-1$ , получает различные варианты поведения системы, вычисляет для них функцию стоимости $Q(k)$ и определяет наилучшую стратегию управления $ST=\{{\hat {u}}(k,j_{1})~{\hat {u}}(k,j_{2})~\ldots ~~{\hat {u}}(k,j_{L})\}$ . В итоге, на объект подается управляющий сигнал ${\hat {u}}(k,j_{1})$ . На следующем такте стратегия $ST$ пересчитывается заново.

Адаптивные критики править

Схема адаптивной критики: слева — этап управления; справа — этап обучения

Методы нейроуправления на основе адаптивной критики (adaptive critics), которые также известны как приближенное динамическое программирование (approximated dynamic programming, ADP), в последние годы весьма популярны^[33]^[34]^[35]^[36]. Системы адаптивной критики выбирают управляющий сигнал на основе минимизации функционала оценок ошибок будущего с бесконечным горизонтом:

J(k)=\sum _{i=0}^{\infty }\gamma ^{i}e(k+i)^{2}.

Здесь $\gamma$ — коэффициент забывания, $0<\gamma \leq 1$ , $e(k)=r(k+1)-y(k+1)$ — отклонение траектории объекта управления от уставки, вычисляемое на каждом такте работы системы. Система включает два нейронных модуля: нейроконтроллер и модуль критики (критик). Модуль критики выполняет аппроксимацию значений функционала стоимости $J(k)$ , нейроконтроллер обучают минимизировать функционал стоимости $J(k)$ .

В режиме управления объектом на вход нейроконтроллера поступает вектор $x(k)=[r(k+1)~S(k)]^{T}$ , вызывающий появление на его выходе сигнала управления $u(k)$ , в результате чего объект управления переходит в положение $y(k+1)$ . Далее производится вычисление значения текущей ошибки управления $e(k)$ . Модуль критики, получая на входе вектор $z(k)=[r(k+1)~u(k)~S(k)]^{T}$ , производит оценку функции стоимости $J(k)$ . На следующем такте процесс повторяется: вычисляются новые значения $e(k+1)$ и $J(k+1)$ . Обучение системы нейроуправления происходит в режиме онлайн и состоит из двух этапов: обучения модуля критики и обучения нейроконтроллера. Сначала рассчитывается ошибка временной разности $\delta w(k)=e(k)+\gamma J(k+1)-J(k)$ . Затем по методу наискорейшего спуска выполняется коррекция веса связей для модуля критики $w_{critic}$ :

\Delta w_{critic}(k)=-{\alpha }_{1}\delta (k){\frac {\partial J(k)}{\partial w_{critic}(k)}}

Значение градиента ${\frac {\partial J(k)}{\partial w_{critic}(k)}}$ рассчитывается по методу обратного распространения ошибки. Коррекция веса связей нейроконтроллера $\Delta w_{control}$ производится аналогично:

$\Delta w_{control}(k)=-{\alpha }_{2}{\frac {\partial J(k)}{\partial u(k)}}{\frac {\partial u(k)}{\partial w_{control}(k)}}$

Значение производной ${\frac {\partial J(k)}{\partial u(k)}}$ находят путём обратного распространения величины через модуль критики, а значение градиента ${\frac {\partial u(k)}{\partial w_{control}(k)}}$ — путём обратного распространения ошибки через модуль контроллера. Коррекция весов продолжается, пока система не достигнет требуемого уровня качества управления. Таким образом, на каждом шаге улучшается закон управления, путём обучения нейроконтроллера (итерация по стратегиям, policy iteration), а также повышается способность системы оценивать ситуацию, путём обучения критика (итерация по значениям, value iteration). Конкретная схема построения системы адаптивной критики может отличаться от вышеописанной, носящей название эвристическое динамическое программирование (heuristic dynamic programming, HDP). В методе дуального эвристического программирования (dual heuristic programming, DHP) модуль критики вычисляет производную функционала глобальной стоимости ${\frac {\partial J}{\partial t}}$ , а в методе глобального дуального эвристического программирования (global dual heuristic programming, GHDP) критиком вычисляются как сам функционал функции стоимости $J$ , так и его производная ${\frac {\partial J}{\partial t}}$ . Известны модификации метода, в которых модуль критики принимает решения исключительно на основе управляющего сигнала. Их англоязычные аббревиатуры имеют приставку AD (action dependent): ADHDP, ADDHP, ADGDHP. В некоторых версиях адаптивной критики модуль критики состоит из двух частей: собственно, модуля критики и прямого нейроэмулятора. Последний выдает предсказания поведение объекта управления, на основе которых критик формирует оценку функции стоимости $J$ . Такие версии носят название основанные на модели (model based).

Гибридное нейро-ПИД управление править

Схема гибридного нейро-ПИД управления

Гибридное нейро-ПИД управление (NNPID auto-tuning, neuromorphic PID self-tuning)^[37]^[38] позволяет осуществлять самонастройку ПИД-регулятора в режиме онлайн путём использованием нейронных сетей. Настройка ПИД-регулятора выполняется в режиме онлайн, по текущей ошибке управления $e(k)=r(k+1)-y(k+1)$ . На такте $k$ нейронная сеть получает уставку $r(k+1)$ и генерирует коэффициенты управления ПИД-контроллера $K_{1}$ (пропорциональный), $K_{2}$ (интегральный), $K_{3}$ (дифференциальный), которые поступают на ПИД-контроллер вместе со значением текущей ошибки обратной связи $e(k)$ . В ходе работы, ПИД-контроллер рассчитывает текущий управляющий сигнал $u(k)$ по рекуррентной формуле:

u(k)=u(k-1)+K_{1}(k)(e(k)-e(k-1))+K_{2}(k)e(k)+K_{3}(k)(e(k)-2e(k-1)+e(k-2))

применяемой для дискретных ПИД-контроллеров и подает его на объект управления.

Обучение нейросети происходит в режиме реального времени по ошибке обратной связи, методом наискорейшего спуска.

\Delta w(k)=-\alpha e(k){\frac {\partial y(k+1)}{\partial u(k)}}{\frac {\partial u(k)}{\partial K(k)}}{\frac {\partial K(k)}{\partial w(k)}}

Здесь $K(k)=[K_{1}(k)~K_{2}(k)~K_{3}(k)]^{T}$ — вектор выходов нейронной сети, поступающий на ПИД-контроллер.

{\frac {\partial u(k)}{\partial K_{i}(k)}}={\Bigg \{}{\begin{matrix}e(k)-e(k-1)&for~i=1;\\e(k)&for~i=2;\\e(k)-2e(k-1)+e(k-2)&for~i=3.\end{matrix}}

Градиенты ${\frac {\partial K_{i}(k)}{\partial w(k)}}$ вычисляют методом обратного распространения ошибки. Якобиан объекта управления ${\frac {\partial y(k+1)}{\partial u(k)}}$ ли его знак находится аналитически, на основе математической модели объекта управления.

Гибридное параллельное нейроуправление править

Схема гибридного параллельного нейроуправления

Методы гибридного параллельного нейроуправления (parallel neurocontrol, stable direct adaptive control, additive feedforward control)^[26]^[29] предусматривают параллельное использование нейроконтроллеров и обычных контроллеров для управления динамическими объектами. При этом нейроконтроллер и обычный контроллер, в роли которого выступает, например, ПИД-контроллер, получают одинаковые значения уставки. Возможны следующие варианты совместного подключения обычного контроллера и нейроконтроллера:

к объекту управления подключается обычный контроллер, после чего нейроконтроллер обучается управлять уже замкнутой обычным контроллером системой. После обучения нейроконтроллер подключается к системе, а управляющие сигналы обоих контроллеров суммируются;
нейроконтроллер учится управлять объектом управления, после обучения начинает функционировать в штатном режиме. Далее для управления замкнутой нейроконтроллером системой настраивается обычный контроллер. После настройки обычный контроллер подключается к системе, управляющий сигнал обоих контроллеров суммируется;
области действия обычного контроллера и нейроконтроллера разграничиваются. Например, в пространстве состояний объекта управления для нейроконтроллера выделяется отдельная область $LS$ :

LS=[(y_{1}-d_{1};y_{1}+d_{1})~\ldots ~(y_{N}-d_{N};y_{N}+d_{N})]^{T}

При этом обычный контроллер рассчитывается на управление объектом вне этой области пространства состояния. При параллельной работе обоих контроллеров управляющий сигнал поступает на объект либо от нейроконтроллера, если текущее состояние системы находится в пределах области $LS$ , либо, в противном случае, от обычного контроллера. Гибридное параллельное нейроуправление представляет компромиссное решение для внедрения нейроуправления в промышленность и перехода от обычных контроллеров к нейросетевым.

Примечания править

↑ Вороновский Г. К., Генетические алгоритмы, искусственные нейронные сети, 1997 (неопр.). Дата обращения: 3 сентября 2011. Архивировано из оригинала 19 августа 2011 года.
↑ Werbos, P.J. Backpropagation and neurocontrol: a review and prospectus // International Joint Conference on Neural Networks, Vol. 1. — P. 209—216. — Washington, DC , USA, 18-22 Jun 1989
↑ Gundy-Burlet K., Krishnakumar K., Limes G., Bryant D. Augmentation of an Intelligent Flight Control System for a Simulated C-17 Aircraft // J. of Aerospace Computing, Information, and Communication. — 2004. — Vol. 1, N 12. — P. 526—542 (неопр.). Дата обращения: 26 августа 2011. Архивировано 6 марта 2016 года.
↑ Кондратьев А. И., Тюменцев Ю. В. Нейросетевое адаптивное отказоустойчивое управление движением маневренного самолета // XII Всероссийская научно-техническая конференция «Нейроинформатика — 2010»: Часть 2. — М.: НИЯУ МИФИ, 2010. — С. 262—273. (неопр.) Дата обращения: 28 октября 2011. Архивировано 4 марта 2016 года.
↑ Никифорова Л. Н., Петросян Э. А., Якеменко Г. В. Нейрокомпьютеры в управлении вертолетами // Искусственный интеллект. — 2000. — № 3. — С. 290—298 (неопр.). Дата обращения: 28 октября 2011. Архивировано 10 октября 2015 года.
↑ D. Gu and H. Hu. Neural Predictive Control for a Car-like Mobile Robot // International Journal of Robotics and Autonomous Systems, Vol. 39, No. 2-3, May, 2002
↑ [Терехов В. А., Ефимов Д. В., Тюкин И. Ю. Нейросетевые системы управления: Учеб. пособие для вузов. — М.: Высш. школа 2002. — 183 с.]
↑ ¹ ² Danil V. Prokhorov. Toyota Prius HEV Neurocontrol and Diagnostics // Neural Networks. — 2008. — No. 21. — P. 458—465 (неопр.). Дата обращения: 2 сентября 2011. Архивировано 31 июля 2009 года.
↑ Dias F.M., Mota A.M. Comparison between Different Control Strategies using Neural Networks // 9th Mediterranean Conference on Control and Automation. — Dubrovnik, Croatia, 2001 (неопр.). Дата обращения: 26 августа 2011. Архивировано 27 сентября 2016 года.
↑ Venayagamoorthy G.K., Harley R.G., Wunsch D.C. Implementation of Adaptive Critic-based Neurocontrollers for Turbogenerators in a Multimachine Power System, IEEE Transactions on Neural Networks. — 2003. — Vol. 14, Issue 5. — P. 1047—1064. (неопр.) Дата обращения: 26 августа 2011. Архивировано из оригинала 12 июня 2010 года.
↑ D’Emilia G., Marrab A., Natalea E. Use of neural networks for quick and accurate auto-tuning of PID controller // Robotics and Computer-Integrated Manufacturing. — 2007. — Vol. 23. — P. 170—179.
↑ Змеу К. В., Марков Н. А., Шипитько И. А., Ноткин Б. С. Безмодельное прогнозирующее инверсное нейроуправление с регенерируемым эталонным переходным процессом // Интеллектуальные системы. — 2009. — № 3. — С. 109—117. (неопр.) Дата обращения: 26 августа 2011. Архивировано 27 сентября 2016 года.
↑ Кузнецов Б. И., Василец Т. Е., Варфоломеев А. А. Синтез нейроконтроллера с предсказанием для двухмассовой электромеханической системы //Электротехника и электромеханика. — 2008. — Т. 3. — С. 27 — 32. (неопр.) Дата обращения: 28 октября 2011. Архивировано из оригинала 26 октября 2015 года.
↑ Д. А. Дзюба, А. Н. Чернодуб. Применение метода контролируемого возмущения для модификации нейроконтроллеров в реальном времени // Математические Машины и Системы. — 2010. — № 4. — С. 20 — 28. (неопр.) Дата обращения: 26 августа 2011. Архивировано 28 апреля 2011 года.
↑ Сабании В.Р. Автоматические системы регулирования на основе нейросетевых технологий / В.Р Сабанин, Н.И Смирнов, А.И. Репин // Труды Международной научной конференции Control-2003. М.: Издательство МЭИ, 2003.С. 45—51.
↑ [Widrow B., Smith F.W. Pattern-recognizing control systems // Proceedings of Computer and Information Sciences. — Washington, USA — 1964. — Vol. 12. — P. 288—317.]
↑ Omidvar O., Elliott D.L. eds. Neural Systems for Control // Academic Press, New York, 1997. — 358 с.
↑ Ronco E. Incremental Polynomial Controller Networks: Two Self-Organising Non-Linear Controllers // Ph.D. Disseration Thesis, Glasgow, 1997. — 207 p.
↑ ¹ ² [Омату С., Халид М., Юсоф Р. Нейроуправление и его приложения: пер. с англ. — М.: ИПРЖР, 2000. — 272 с.]
↑ ¹ ² Psaltis D., Sideris A., Yamamura A.A. A Multilayered Neural Network Controller // IEEE Control Systems Magazine — 1988. — Vol. 8, Issue 2. — P. 17 — 21. (недоступная ссылка)
↑ Werbos P. Backpropagation through time: what it does and how to do it // Proceedings of the IEEE. — October 1990. — Vol. 78, N. 10. — P. 1550—1560 (неопр.). Дата обращения: 24 сентября 2011. Архивировано из оригинала 13 июня 2010 года.
↑ [Jordan M.I. and Rumelhart D.E. Forwardmodels: Supervised learning with a distal teacher // Cognitive Science — 1990. — Vol. 16. — P. 313—355.]
↑ ¹ ² [Narendra K.S., Parthasarathy K.K. Identification and control of dynamical systems using neural networks // IEEE Transactions on Neural Networks. — 1990. — N 1. — P. 4 — 27.]
↑ Venelinov Topalov, A. Kaynak. Online learning in adaptive neurocontrol schemes with a sliding mode algorithm // IEEE Transactions on Systems, Man, and Cybernetics, Part B: Cybernetics. — 2001. — V. 31. — I. 3. — P. 445—450 (неопр.). Дата обращения: 28 октября 2011. Архивировано 18 ноября 2017 года.
↑ А. Н. Чернодуб. Обучение нейроэмуляторов с использованием псевдорегуляризации для метода нейроуправления с эталонной моделью // Искусственный Интеллект. — 2012. — No. 4. — C. 602—614 (недоступная ссылка)
↑ ¹ ² Dias F.M., Mota A.M. Comparison between Different Control Strategies using Neural Networks // 9th Mediterranean Conference on Control and Automation. — Dubrovnik, Croatia, 2001. (неопр.) Дата обращения: 26 августа 2011. Архивировано 27 сентября 2016 года.
↑ Widrow B., Adaptive Inverse Control // Proceedings of the 2nd IFAC Workshop on Adaptive Systems in Control and Signal Processing — Lund, Sweden, July 1986. — P. 1 — 5. (неопр.) Дата обращения: 24 сентября 2011. Архивировано 6 марта 2016 года.
↑ Widrow B., Plett G.L. Adaptive Inverse Control based on Linear and Nonlinear Adaptive Filtering // Proceedings of International Workshop on Neural Networks for Identification, Control, Robotics, and Signal/Image Processing — 21 23 Aug 1996, Venice, Italy. — P. 30 — 38.
↑ ¹ ² Neural networks for control (англ.) // Proceedings of the 1999 American Control Conference (Cat. No. 99CH36251). — 1999. — ISBN 0780349903. — doi:10.1109/ACC.1999.786109. [исправить]
↑ Rossiter J.A. Model-Based Predictive Control (англ.). — 2017. — 12 July. — ISBN 9781315272610. — doi:10.1201/9781315272610. [исправить]
↑ Takahashi Y. Adaptive predictive control of nonlinear time-varying systems using neural networks (англ.) // IEEE International Conference on Neural Networks. — ISBN 0780309995. — doi:10.1109/ICNN.1993.298772. [исправить]
↑ Soloway D., Haley P.J. Neural generalized predictive control (англ.) // Proceedings of the 1996 IEEE International Symposium on Intelligent Control. — ISBN 0780329783. — doi:10.1109/ISIC.1996.556214. [исправить]
↑ Prokhorov D. and Wunsch D. Adaptive Critic Designs // IEEE Transactions on Neural Networks. — 1997. — Vol. 8, N 5. — P. 997—1007. (неопр.) Дата обращения: 25 сентября 2011. Архивировано 8 июля 2013 года.
↑ Venayagamoorthy G.K., Harley R.G., Wunsch D.C. Implementation of Adaptive Critic-based Neurocontrollers for Turbogenerators in a Multimachine Power System", IEEE Transactions on Neural Networks. — 2003. — Vol. 14, Issue 5. — P. 1047—1064. (неопр.) Дата обращения: 26 августа 2011. Архивировано из оригинала 12 июня 2010 года.
↑ Ferrari S., Stengel R.F. Model-Based Adaptive Critic Designs // Learning and Approximated Dynamic Programming, J. Si, A. Barto, W. Powell, and D. Wunsch, Eds. New York: Wiley, 2004, Chapter. 3 (неопр.). Дата обращения: 25 сентября 2011. Архивировано 17 апреля 2012 года.
↑ Редько В. Г., Прохоров Д. В. Нейросетевые адаптивные критики // VI Всероссийская научно-техническая конференция «Нейроинформатика-2004». Сборник научных трудов. Часть 2. М.: МИФИ, 2004. — C. 77 — 84. (неопр.) Дата обращения: 25 сентября 2011. Архивировано 11 мая 2011 года.
↑ D’Emilia Giulio, Marra Antonio, Natale Emanuela. Use of neural networks for quick and accurate auto-tuning of PID controller (англ.) // Robotics and Computer-Integrated Manufacturing. — 2007. — April (vol. 23, no. 2). — P. 170—179. — ISSN 0736-5845. — doi:10.1016/j.rcim.2006.04.001. [исправить]
↑ Akhyar S., Omatu S. Neuromorphic self-tuning PID controller (англ.) // IEEE International Conference on Neural Networks. — ISBN 0780309995. — doi:10.1109/ICNN.1993.298617. [исправить]

Ссылки править

Литература править

Сигеру Омату, Марзуки Халид, Рубия Юсоф. Нейроуправление и его приложения = Neuro-Control and its Applications. — 2-е. — М.: ИПРЖР, 2000. — С. 272. — ISBN ISBN 5-93108-006-6.
В. А. Терехов, Д. В. Ефимов, И. Ю. Тюкин. Нейросетевые системы управления. — 1-е. — Высшая школа, 2002. — С. 184. — ISBN 5-06-004094-1.
Хайкин С. Нейронные сети: полный курс = Neural Networks: A Comprehensive Foundation. — 2-е. — М.: «Вильямс», 2006. — С. 1104. — ISBN 0-13-273350-1.
Omidvar O., Elliott D.L. eds. Neural Systems for Control. — New York: Academic Press, 1997. — С. 358. — ISBN 0-12-526430-5.

[1] Вороновский Г. К., Генетические алгоритмы, искусственные нейронные сети, 1997 (неопр.). Дата обращения: 3 сентября 2011. Архивировано из оригинала 19 августа 2011 года.

[2] Werbos, P.J. Backpropagation and neurocontrol: a review and prospectus // International Joint Conference on Neural Networks, Vol. 1. — P. 209—216. — Washington, DC , USA, 18-22 Jun 1989

[3] Gundy-Burlet K., Krishnakumar K., Limes G., Bryant D. Augmentation of an Intelligent Flight Control System for a Simulated C-17 Aircraft // J. of Aerospace Computing, Information, and Communication. — 2004. — Vol. 1, N 12. — P. 526—542 (неопр.). Дата обращения: 26 августа 2011. Архивировано 6 марта 2016 года.

[4] Кондратьев А. И., Тюменцев Ю. В. Нейросетевое адаптивное отказоустойчивое управление движением маневренного самолета // XII Всероссийская научно-техническая конференция «Нейроинформатика — 2010»: Часть 2. — М.: НИЯУ МИФИ, 2010. — С. 262—273. (неопр.) Дата обращения: 28 октября 2011. Архивировано 4 марта 2016 года.

[5] Никифорова Л. Н., Петросян Э. А., Якеменко Г. В. Нейрокомпьютеры в управлении вертолетами // Искусственный интеллект. — 2000. — № 3. — С. 290—298 (неопр.). Дата обращения: 28 октября 2011. Архивировано 10 октября 2015 года.

[6] D. Gu and H. Hu. Neural Predictive Control for a Car-like Mobile Robot // International Journal of Robotics and Autonomous Systems, Vol. 39, No. 2-3, May, 2002

[7] [Терехов В. А., Ефимов Д. В., Тюкин И. Ю. Нейросетевые системы управления: Учеб. пособие для вузов. — М.: Высш. школа 2002. — 183 с.]

[autogenerated2-8] ¹ ² Danil V. Prokhorov. Toyota Prius HEV Neurocontrol and Diagnostics // Neural Networks. — 2008. — No. 21. — P. 458—465 (неопр.). Дата обращения: 2 сентября 2011. Архивировано 31 июля 2009 года.

[9] Dias F.M., Mota A.M. Comparison between Different Control Strategies using Neural Networks // 9th Mediterranean Conference on Control and Automation. — Dubrovnik, Croatia, 2001 (неопр.). Дата обращения: 26 августа 2011. Архивировано 27 сентября 2016 года.

[10] Venayagamoorthy G.K., Harley R.G., Wunsch D.C. Implementation of Adaptive Critic-based Neurocontrollers for Turbogenerators in a Multimachine Power System, IEEE Transactions on Neural Networks. — 2003. — Vol. 14, Issue 5. — P. 1047—1064. (неопр.) Дата обращения: 26 августа 2011. Архивировано из оригинала 12 июня 2010 года.

[11] D’Emilia G., Marrab A., Natalea E. Use of neural networks for quick and accurate auto-tuning of PID controller // Robotics and Computer-Integrated Manufacturing. — 2007. — Vol. 23. — P. 170—179.

[12] Змеу К. В., Марков Н. А., Шипитько И. А., Ноткин Б. С. Безмодельное прогнозирующее инверсное нейроуправление с регенерируемым эталонным переходным процессом // Интеллектуальные системы. — 2009. — № 3. — С. 109—117. (неопр.) Дата обращения: 26 августа 2011. Архивировано 27 сентября 2016 года.

[13] Кузнецов Б. И., Василец Т. Е., Варфоломеев А. А. Синтез нейроконтроллера с предсказанием для двухмассовой электромеханической системы //Электротехника и электромеханика. — 2008. — Т. 3. — С. 27 — 32. (неопр.) Дата обращения: 28 октября 2011. Архивировано из оригинала 26 октября 2015 года.

[14] Д. А. Дзюба, А. Н. Чернодуб. Применение метода контролируемого возмущения для модификации нейроконтроллеров в реальном времени // Математические Машины и Системы. — 2010. — № 4. — С. 20 — 28. (неопр.) Дата обращения: 26 августа 2011. Архивировано 28 апреля 2011 года.

[15] Сабании В.Р. Автоматические системы регулирования на основе нейросетевых технологий / В.Р Сабанин, Н.И Смирнов, А.И. Репин // Труды Международной научной конференции Control-2003. М.: Издательство МЭИ, 2003.С. 45—51.

[16] [Widrow B., Smith F.W. Pattern-recognizing control systems // Proceedings of Computer and Information Sciences. — Washington, USA — 1964. — Vol. 12. — P. 288—317.]

[17] Omidvar O., Elliott D.L. eds. Neural Systems for Control // Academic Press, New York, 1997. — 358 с.

[18] Ronco E. Incremental Polynomial Controller Networks: Two Self-Organising Non-Linear Controllers // Ph.D. Disseration Thesis, Glasgow, 1997. — 207 p.

[autogenerated1-19] ¹ ² [Омату С., Халид М., Юсоф Р. Нейроуправление и его приложения: пер. с англ. — М.: ИПРЖР, 2000. — 272 с.]

[autogenerated3-20] ¹ ² Psaltis D., Sideris A., Yamamura A.A. A Multilayered Neural Network Controller // IEEE Control Systems Magazine — 1988. — Vol. 8, Issue 2. — P. 17 — 21. (недоступная ссылка)

[21] Werbos P. Backpropagation through time: what it does and how to do it // Proceedings of the IEEE. — October 1990. — Vol. 78, N. 10. — P. 1550—1560 (неопр.). Дата обращения: 24 сентября 2011. Архивировано из оригинала 13 июня 2010 года.

[22] [Jordan M.I. and Rumelhart D.E. Forwardmodels: Supervised learning with a distal teacher // Cognitive Science — 1990. — Vol. 16. — P. 313—355.]

[autogenerated6-23] ¹ ² [Narendra K.S., Parthasarathy K.K. Identification and control of dynamical systems using neural networks // IEEE Transactions on Neural Networks. — 1990. — N 1. — P. 4 — 27.]

[24] Venelinov Topalov, A. Kaynak. Online learning in adaptive neurocontrol schemes with a sliding mode algorithm // IEEE Transactions on Systems, Man, and Cybernetics, Part B: Cybernetics. — 2001. — V. 31. — I. 3. — P. 445—450 (неопр.). Дата обращения: 28 октября 2011. Архивировано 18 ноября 2017 года.

[25] А. Н. Чернодуб. Обучение нейроэмуляторов с использованием псевдорегуляризации для метода нейроуправления с эталонной моделью // Искусственный Интеллект. — 2012. — No. 4. — C. 602—614 (недоступная ссылка)

[autogenerated4-26] ¹ ² Dias F.M., Mota A.M. Comparison between Different Control Strategies using Neural Networks // 9th Mediterranean Conference on Control and Automation. — Dubrovnik, Croatia, 2001. (неопр.) Дата обращения: 26 августа 2011. Архивировано 27 сентября 2016 года.

[27] Widrow B., Adaptive Inverse Control // Proceedings of the 2nd IFAC Workshop on Adaptive Systems in Control and Signal Processing — Lund, Sweden, July 1986. — P. 1 — 5. (неопр.) Дата обращения: 24 сентября 2011. Архивировано 6 марта 2016 года.

[28] Widrow B., Plett G.L. Adaptive Inverse Control based on Linear and Nonlinear Adaptive Filtering // Proceedings of International Workshop on Neural Networks for Identification, Control, Robotics, and Signal/Image Processing — 21 23 Aug 1996, Venice, Italy. — P. 30 — 38.

[autogenerated5-29] ¹ ² Neural networks for control (англ.) // Proceedings of the 1999 American Control Conference (Cat. No. 99CH36251). — 1999. — ISBN 0780349903. — doi:10.1109/ACC.1999.786109. [исправить]

[30] Rossiter J.A. Model-Based Predictive Control (англ.). — 2017. — 12 July. — ISBN 9781315272610. — doi:10.1201/9781315272610. [исправить]

[31] Takahashi Y. Adaptive predictive control of nonlinear time-varying systems using neural networks (англ.) // IEEE International Conference on Neural Networks. — ISBN 0780309995. — doi:10.1109/ICNN.1993.298772. [исправить]

[32] Soloway D., Haley P.J. Neural generalized predictive control (англ.) // Proceedings of the 1996 IEEE International Symposium on Intelligent Control. — ISBN 0780329783. — doi:10.1109/ISIC.1996.556214. [исправить]

[33] Prokhorov D. and Wunsch D. Adaptive Critic Designs // IEEE Transactions on Neural Networks. — 1997. — Vol. 8, N 5. — P. 997—1007. (неопр.) Дата обращения: 25 сентября 2011. Архивировано 8 июля 2013 года.

[34] Venayagamoorthy G.K., Harley R.G., Wunsch D.C. Implementation of Adaptive Critic-based Neurocontrollers for Turbogenerators in a Multimachine Power System", IEEE Transactions on Neural Networks. — 2003. — Vol. 14, Issue 5. — P. 1047—1064. (неопр.) Дата обращения: 26 августа 2011. Архивировано из оригинала 12 июня 2010 года.

[35] Ferrari S., Stengel R.F. Model-Based Adaptive Critic Designs // Learning and Approximated Dynamic Programming, J. Si, A. Barto, W. Powell, and D. Wunsch, Eds. New York: Wiley, 2004, Chapter. 3 (неопр.). Дата обращения: 25 сентября 2011. Архивировано 17 апреля 2012 года.

[36] Редько В. Г., Прохоров Д. В. Нейросетевые адаптивные критики // VI Всероссийская научно-техническая конференция «Нейроинформатика-2004». Сборник научных трудов. Часть 2. М.: МИФИ, 2004. — C. 77 — 84. (неопр.) Дата обращения: 25 сентября 2011. Архивировано 11 мая 2011 года.

[37] D’Emilia Giulio, Marra Antonio, Natale Emanuela. Use of neural networks for quick and accurate auto-tuning of PID controller (англ.) // Robotics and Computer-Integrated Manufacturing. — 2007. — April (vol. 23, no. 2). — P. 170—179. — ISSN 0736-5845. — doi:10.1016/j.rcim.2006.04.001. [исправить]

[38] Akhyar S., Omatu S. Neuromorphic self-tuning PID controller (англ.) // IEEE International Conference on Neural Networks. — ISBN 0780309995. — doi:10.1109/ICNN.1993.298617. [исправить]

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

[25]

[26]

[27]

[28]

[29]

[30]

[31]

[32]

[33]

[34]

[35]

[36]

[37]

[38]