Сигмоида

Сигмо́ида (также сигмо́ид) — это гладкая монотонная возрастающая нелинейная функция, имеющая форму буквы «S», которая часто применяется для «сглаживания» значений некоторой величины.

Часто под сигмоидой понимают логистическую функцию

\sigma (x)={\frac {1}{1+e^{-x}}}

.

Сигмоида ограничена двумя горизонтальными асимптотами, к которым стремится при стремлении аргумента к $\pm \infty$ . В зависимости от соглашения, этими асимптотами могут быть y = ±1 (в $\pm \infty$ ) либо y = 0 в $-\infty$ и y = +1 в $+\infty$ .

Производная сигмоиды представляет собой колоколообразную кривую с максимумом в нуле, асимптотически стремящуюся к нулю в $+\infty$ .

Семейство функций класса сигмоид

Сравнение некоторых сигмоидных функций, нормализованных таким образом, чтобы производная в начале координат была равна 1

В семейство функций класса сигмоид входят такие функции, как арктангенс, гиперболический тангенс и другие функции подобного вида.

Функция Ферми — Дирака (экспоненциальная сигмоида):

f(x)={\frac {1}{1+e^{-2\alpha x}}},\quad \alpha >0

.

Рациональная сигмоида:

f(x)={\frac {x}{|x|+\alpha }},\quad \alpha >0

.

Арктангенс:

f(x)=\operatorname {arctg} x

.

Гиперболический тангенс:

f(x)=\operatorname {th} {\frac {x}{\alpha }}={\frac {e^{\frac {x}{\alpha }}-e^{-{\frac {x}{\alpha }}}}{e^{\frac {x}{\alpha }}+e^{-{\frac {x}{\alpha }}}}}

.

Гладкая ступенька N-го порядка:

f(x)={\begin{cases}\left(\int _{0}^{1}{\big (}1-u^{2}{\big )}^{N}\ du\right)^{-1}\int _{0}^{x}{\big (}1-u^{2}{\big )}^{N}\ du\quad &|x|\leq 1\\\operatorname {sgn}(x)&|x|\geq 1\\\end{cases}}\,\quad N\geq 1

.

Корневая сигмоида:

f(x)={\frac {x}{\sqrt {1+x^{2}}}}

.

Логистическая функция:

f(x)=(1+e^{-x})^{-1}

.

Обобщённая логистическая функция:

f(x)=(1+e^{-x})^{-\alpha },\quad \alpha >0

.

Функция ошибок:

f(x)=\operatorname {erf} (x)={\frac {2}{\sqrt {\pi }}}\int _{0}^{x}e^{-t^{2}}\,dt

.

Функция Гудермана:

f(x)=\operatorname {gd} x=\int _{0}^{x}{\frac {1}{\cosh t}}\,dt=\operatorname {arctg} (\operatorname {sh} x)

.

Применение

Нейронные сети

Сигмоиды применяются в нейронных сетях в качестве функций активации. Они позволяют нейронам как усиливать слабые сигналы, так и не насыщаться от сильных сигналов^[1].

В нейронных сетях часто используются сигмоиды, производные которых могут быть выражены через саму функцию. Это позволяет существенно сократить вычислительную сложность метода обратного распространения ошибки, сделав его применимым на практике:

\sigma '(x)=(1+\sigma (x))\cdot (1-\sigma (x))

— для гиперболического тангенса;

\sigma '(x)=\sigma (x)\cdot (1-\sigma (x))

— для логистической функции.

Логистическая регрессия

Логистическая функция $f(x)={\frac {1}{1+e^{-x}}}$ используется в решении задач классификации с использованием логистической регрессии. Пусть решается задача классификации с двумя классами ( $y=0$ и $y=1$ , где $y$ — переменная, указывающая класс объекта). Делается предположение о том, что вероятность принадлежности объекта к одному из классов выражается через значения признаков этого объекта $x_{1},x_{2},...,x_{n}$ (действительные числа):

\mathbb {P} \{y=1\mid x_{1},\ldots ,x_{n}\}=f(a_{1}x_{1}+\ldots +a_{n}x_{n})={\frac {1}{1+\exp(-a_{1}x_{1}-\ldots -a_{n}x_{n})}}

,

где $a_{1},...,a_{n}$ — некоторые коэффициенты, требующие подбора, обычно, методом наибольшего правдоподобия.

Именно такая функция $f(x)$ получается при использовании обобщённой линейной модели и предположения, что зависимая переменная $y$ распределена по закону Бернулли.

См. также

Литература

Mitchell, Tom M. Machine Learning. — WCB–McGraw–Hill, 1997. — ISBN 0-07-042807-7.

Примечания

↑ Функции активации в нейронных сетях (неопр.). Дата обращения: 11 сентября 2014. Архивировано из оригинала 24 июля 2014 года.

Ссылки

[1] Функции активации в нейронных сетях (неопр.). Дата обращения: 11 сентября 2014. Архивировано из оригинала 24 июля 2014 года.

[1]