Полуопределённое программирование

Полуопределённое программирование (или SDP от англ. Semidefinite programming) — подраздел выпуклого программирования, которое занимается оптимизацией линейной целевой функции (целевая функция — это заданная пользователем функция, значение которой пользователь хочет минимизировать или максимизировать) на пересечении конусов положительно полуопределённых матриц с аффинным пространством.

Полуопределённое программирование является относительно новой областью оптимизации, интерес к которой растёт по нескольким причинам. Много практических задач в областях исследования операций и комбинаторной оптимизации можно смоделировать или аппроксимировать как задачи полуопределённого программирования. В теории автоматического управления задачи SDP используются в контексте линейных матричных неравенств. Задачи SDP, фактически, являются частным случаем конического программирования^[en] и могут быть эффективно решены методом внутренней точки. Все задачи линейного программирования могут быть выражены как задачи SDP, а с помощью иерархий задач SDP могут быть аппроксимированы решения задач полиномиальной оптимизации. Полуопределённое программирование используется при оптимизации сложных систем. В последние годы некоторые задачи сложности квантовых запросов были сформулированы в терминах полуопределённого программирования.

Мотивация и определение править

Исходные мотивации править

Задача линейного программирования — это задача, в которой нужно максимизировать или минимизировать линейную целевую функцию от вещественных переменных на многограннике. В полуопределённом программировании, вместо этого мы используем вещественные вектора и нам позволено использовать скалярное произведение векторов. Условие неотрицательности вещественных переменных задачи ЛП заменяется ограничениями полуопределённости на матрице переменных задачи SDP. В частности, общая задача полуопределённого программирования может быть определена как любая задача математического программирования вида

{\min _{x^{1},\ldots ,x^{n}\in \mathbb {R} ^{n}}}{\sum _{i,j\in [n]}c_{i,j}(x^{i}\cdot x^{j})}

при условиях

{\sum _{i,j\in [n]}a_{i,j,k}(x^{i}\cdot x^{j})\leq b_{k}\qquad \forall k}.

Эквивалентные формулировки править

Говорят, что $n\times n$ матрица $M$ положительно полуопределённа, если она является матрицей Грама некоторых векторов (т.е. если существуют вектора $x^{1},\ldots ,x^{n}$ , такие, что $m_{i,j}=x^{i}\cdot x^{j}$ для всех $i,j$ ). Если это выполняется, мы обозначим это как $M\succeq 0$ . Заметим, что существуют некоторые другие эквивалентные определения положительной полуопределённости, например, положительно полуопределённые матрицы имеют только неотрицательные собственные значения и имеет положительно полуопределённый квадратный корень.

Обозначим через $\mathbb {S} ^{n}$ пространство всех $n\times n$ вещественных симметричных матриц. В этом пространстве имеется скалярное произведение $\langle A,B\rangle _{\mathbb {S} ^{n}}={\rm {tr}}(A^{T}B)=\sum _{i=1,j=1}^{n}A_{ij}B_{ij}.$ (где ${\rm {tr}}$ означает след)

Мы можем переписать задачу математического программирования из предыдущей секции в эквивалентном виде

{\min _{X\in \mathbb {S} ^{n}}}\langle C,X\rangle _{\mathbb {S} ^{n}}

при условиях

{\begin{array}{ll}{\displaystyle \langle A_{k},X\rangle _{\mathbb {S} ^{n}}\leq b_{k},\quad k=1,\ldots ,m}\\X\succeq 0\end{array}}

где элемент $i,j$ матрицы $C$ равно $c_{i,j}$ из предыдущей секции, а $A_{k}$ — $n\times n$ матрица, имеющая в качестве элемента $i,j$ матрицы значение $a_{i,j,k}$ из предыдущей секции.

Заметим, что если мы добавим дополнительные переменные^[en] должным образом, эта задача SDP может быть преобразована к виду

\min _{X\in \mathbb {S} ^{n}}}\langle C,X\rangle _{\mathbb {S} ^{n}

при условиях

{\begin{array}{ll}\langle A_{k},X\rangle _{\mathbb {S} ^{n}}=b_{k},\quad k=1,\ldots ,m\\X\succeq 0\end{array}}

Для удобства задача SDP может быть определена слегка в другой, но эквивалентной форме. Например, линейные выражения, использующие неотрицательные скалярные переменные могут быть добавлены в спецификацию задачи. Задача остаётся SDP, поскольку каждая переменная может быть включена в матрицу $X$ как диагональный элемент ( $X_{ii}$ для некоторого $i$ ). Чтобы обеспечить $X_{ii}\geq 0$ , можно добавить ограничения $X_{ij}=0$ для всех $j\neq i$ . В качестве другого примера, заметим, что для любой положительной полуопределённой матрицы $X$ , существует набор векторов $\{v_{i}\}$ , таких, что элемент $i$ , $j$ матрицы $X$ равен $X_{ij}=(v_{i},v_{j})$ , скалярному произведению векторов $v_{i}$ и $v_{j}$ . Таким образом, задачи SDP часто формулируются в терминах линейных выражений от скалярных произведений векторов. Если дано решение задачи SDP в стандартном виде, вектора $\{v_{i}\}$ могут быть восстановлены за время $O(n^{3})$ (например, с помощью неполного разложения Холецкого матрицы X).

Теория двойственности править

Определения править

Аналогично линейному программированию, если задана общая задача SDP в виде

\min _{X\in \mathbb {S} ^{n}}\langle C,X\rangle _{\mathbb {S} ^{n}}

при условиях

{\begin{array}{ll}\langle A_{i},X\rangle _{\mathbb {S} ^{n}}=b_{i},\quad i=1,\ldots ,m\\X\succeq 0\end{array}}

(прямая задача, или P-SDP), мы определим двойственную полуопределённую задачу (D-SDP) как

\max _{y\in \mathbb {R} ^{m}}\langle b,y\rangle _{\mathbb {R} ^{m}}

при условиях

{\begin{array}{ll}{\displaystyle \sum _{i=1}^{m}}y_{i}A_{i}\preceq C\end{array}}

Где для любых двух матриц $P$ и $Q$ , $P\succeq Q$ означает $P-Q\succeq 0$ .

Слабая двойственность править

Теорема о слабой двойственности утверждает, что прямая задача SDP имеет значение, не меньшее значения двойственной SDP. Таким образом, любое допустимое решение двойственной задачи SDP ограничивает снизу значение прямой SDP, и наоборот, любое допустимое значение прямой задачи SDP ограничивает сверху значение двойственной SDP. Это происходит потому, что

\langle C,X\rangle -\langle b,y\rangle =\langle C,X\rangle -\sum _{i=1}^{m}y_{i}b_{i}=\langle C,X\rangle -\sum _{i=1}^{m}y_{i}\langle A_{i},X\rangle =\langle C-\sum _{i=1}^{m}y_{i}A_{i},X\rangle \geq 0,

где последнее неравенство отражает факт положительной полуопределённости обеих матриц. Значение этой функции иногда называется двойственным зазором.

Сильная двойственность править

При условии, известном как условие Слейтера, значения прямой и двойственной SDP-задач равны. Это называется сильной двойственностью. В отличие от задач линейного программирования, не всякая задача SDP обладает строгой двойственностью. В общем случае значение двойственной задачи SDP может быть строго меньше значения прямой задачи.

(i) Предположим, что прямая задача (P-SDP) ограничена снизу и строго допустима (то есть существуют $X_{0}\in \mathbb {S} ^{n},X_{0}\succ 0$ , такие, что $\langle A_{i},X_{0}\rangle _{\mathbb {S} ^{n}}=b_{i}$ , $i=1,\ldots ,m$ ). Тогда имеется оптимальное решение $y^{*}$ для двойственной задачи (D-SDP) и

\langle C,X^{*}\rangle _{\mathbb {S} ^{n}}=\langle b,y^{*}\rangle _{\mathbb {R} ^{m}}.

(ii) Предположим, что двойственная задача (D-SDP) ограничена сверху и строго допустима (то есть $\sum _{i=1}^{m}(y_{0})_{i}A_{i}\prec C$ для некоторого $y_{0}\in \mathbb {R} ^{m}$ ). Тогда существует оптимальное решение $X^{*}$ для прямой задачи (P-SDP) и выполняется равенство из (i).

Примеры править

Пример 1 править

Рассмотрим три случайные переменные $A$ , $B$ и $C$ . По определению, их коэффициенты корреляции $\rho _{AB},\ \rho _{AC},\rho _{BC}$ допустимы тогда и только тогда, когда

{\begin{pmatrix}1&\rho _{AB}&\rho _{AC}\\\rho _{AB}&1&\rho _{BC}\\\rho _{AC}&\rho _{BC}&1\end{pmatrix}}\succeq 0

Предположим, что из каких-то источников (например, из эмпирических или экспериментальных данных) мы знаем, что $-0,2\leq \rho _{AB}\leq -0,1$ и $0,4\leq \rho _{BC}\leq 0,5$ . Задачу определения наименьшего и наибольшего значений $\rho _{AC}\$ можно выписать в виде:

минимизировать/максимизировать

x_{13}

при условиях

-0,2\leq x_{12}\leq -0,1

0,4\leq x_{23}\leq 0,5

x_{11}=x_{22}=x_{33}=1\

{\begin{pmatrix}1&x_{12}&x_{13}\\x_{12}&1&x_{23}\\x_{13}&x_{23}&1\end{pmatrix}}\succeq 0

Здесь мы принимаем $\rho _{AB}=x_{12},\ \rho _{AC}=x_{13},\ \rho _{BC}=x_{23}$ . Задачу можно сформулировать как задачу SDP. Мы дополняем неравенства путём расширения матрицы переменных и введения дополнительных переменных^[en], например

$\mathrm {tr} \left(\left({\begin{array}{cccccc}0&1&0&0&0&0\\0&0&0&0&0&0\\0&0&0&0&0&0\\0&0&0&1&0&0\\0&0&0&0&0&0\\0&0&0&0&0&0\end{array}}\right)\cdot \left({\begin{array}{cccccc}1&x_{12}&x_{13}&0&0&0\\x_{12}&1&x_{23}&0&0&0\\x_{13}&x_{23}&1&0&0&0\\0&0&0&s_{1}&0&0\\0&0&0&0&s_{2}&0\\0&0&0&0&0&s_{3}\end{array}}\right)\right)=x_{12}+s_{1}=-0,1$

После решения этой задачи SDP получим минимум и максимум значений $\rho _{AC}=x_{13}\$ ( $-0,978$ и $0,872$ соответственно).

Пример 2 править

Рассмотрим задачу

минимизировать

{\frac {(c^{T}x)^{2}}{d^{T}x}}

при условиях

Ax+b\geq 0

,

где предполагается, что $d^{T}x>0$ при $Ax+b\geq 0$ .

Введя дополнительную переменную $t$ , перепишем задачу в виде:

минимизировать

t

при условиях

Ax+b\geq 0,\,{\frac {(c^{T}x)^{2}}{d^{T}x}}\leq t

В этой формулировке целевая функция является линейной функцией от двух переменных ( $x,t$ ).

Первое ограничение можно переписать в виде

{\textbf {diag}}(Ax+b)\geq 0

,

где матрица ${\textbf {diag}}(Ax+b)$ является квадратной матрицей со значениями на диагонали, равными элементам вектора $Ax+b$ .

Второе ограничение можно записать в виде

td^{T}x-(c^{T}x)^{2}\geq 0

Определим матрицу $D$ следующим образом

D=\left[{\begin{array}{cc}t&c^{T}x\\c^{T}x&d^{T}x\end{array}}\right]

Мы можем использовать теорию дополнения Шура, чтобы показать, что

D\succeq 0

^[1]

Задача полуоределённого программирования для этой задачи будет иметь вид

минимизировать

t

при условиях

\left[{\begin{array}{ccc}{\textbf {diag}}(Ax+b)&0&0\\0&t&c^{T}x\\0&c^{T}x&d^{T}x\end{array}}\right]\succeq 0

Пример 3 (Аппроксимационный алгоритм Гоеманса — Уильямсона MAX CUT) править

Полуопределённое программирование является важным инструментом для создания аппроксимационных алгоритмов для NP-трудных задач максимизации. Первый аппроксимационный алгоритм, основанный на SDP, предложили Михель Гоеманс и Дэвид Уильямсон^[2]. Они изучали задачу MAX CUT: Дан граф G = (V, E), требуется разбить вершины V на две части так, чтобы максимизировать число рёбер соединяющих эти две части. Задачу можно представить как задачу целочисленного квадратичного программирования:

Максимизировать

\sum _{(i,j)\in E}{\frac {1-v_{i}v_{j}}{2}},

при условии

v_{i}\in \{1,-1\}

для любого

i

.

Если только не P = NP, мы не можем решить эту задачу эффективно. Однако Гоеманс и Уильямсон наметили трёхшаговую процедуру для атаки такого рода задач:

Ослабляем целочисленную задачу квадратичного программирования до задачи SDP.
Решаем задачу SDP (с любой произвольно малой ошибкой $\epsilon$ ).
Округляем решение задачи SDP для получения приближённого решения исходной задачи целочисленного квадратичного программирования.

Для задачи MAX CUT наиболее естественным ослаблением является

\max \sum _{(i,j)\in E}{\frac {1-\langle v_{i},v_{j}\rangle }{2}},

для

\lVert v_{i}\rVert ^{2}=1

, где максимизация осуществляется по векторам

\{v_{i}\}

, а не скалярным целым переменным.

Задача является задачей SDP, поскольку и целевая функция, и ограничения являются линейными функциями от скалярных произведений векторов. Решение задачи SDP даёт набор единичных векторов в $\mathbf {R^{n}}$ . Поскольку вектора не обязательно коллинеарны, значение ослабленной задачи может быть только больше значения исходной целочисленной задачи квадратичного программирования. Конечная процедура округления необходима, чтобы получить разбиение. Гоеманс и Уильямсон выбирают случайную гиперплоскость (используя равномерное распределение), проходящую через начало координат и разбивают вершины в зависимости от расположения относительно этой плоскости. Непосредственный анализ показывает, что эта процедура обеспечивает ожидаемый аппроксимационный коэффициент 0,87856 - ε. (Математическое ожидание значения разреза равно сумме по всем рёбрам вероятностей, что ребро входит в разрез и это ожидание пропорционально углу $\cos ^{-1}\langle v_{i},v_{j}\rangle$ между векторами в конечных вершинах ребра. Если сравнивать эту вероятность с $(1-\langle v_{i},v_{j}\rangle )/{2}$ , математическое ожидание отношения всегда будет не меньшим 0,87856.) В предположении верности гипотезы уникальной игры^[en] можно показать, что аппроксимационный коэффициент этой аппроксимации, главным образом, оптимален.

Со времени появления статья Гоеманса и Уильямсона задачи SDP были применены для разработки большого количества аппроксимационных алгоритмов. Не так давно Прасад Рагхавендра разработал общую схему для задач удовлетворения ограничений, основанную на гипотезе уникальной игры^[en]^[3].

Алгоритмы править

Имеется несколько видов алгоритмов для решения задач SDP. Результат работы этих алгоритмов является значение задачи SDP с точностью до $\epsilon$ , которое получается за время, полиномиально зависящее от размера задачи и $\log(1/\epsilon )$ .

Методы внутренней точки править

Большинство систем решения базируются на методе внутренней точки (CSDP, SeDuMi, SDPT3, DSDP, SDPA), робастном и эффективном для линейных задач SDP общего вида. Подход ограничен в использовании тем фактом, что алгоритмы являются методами второго порядка и требуют запоминания и разложения больших (и, зачастую, плотных) матриц.

Методы первого порядка править

Методы первого порядка для конической оптимизации^[en] избегают запоминания и разложения больших матриц Гессе и применимы к существенно большим по размеру задачам, чем методы внутренней точки, за счёт потери в точности. Метод реализован в системе «SCS solver».

Метод пучков править

Задача SDP формулируется как задача негладкой оптимизации и решается методом спектрального пучка. Этот подход очень эффективен для частных классов линейных задач SDP.

Другие править

Алгоритмы, основанные на методе обобщённого лагранжиана^[en] (PENSDP), близки по поведению к методам внутренней точки и могут быть приспособлены для некоторых очень больших задач. Другие алгоритмы используют низкоуровневую информацию и переформулировку задачи SDP как задачи нелинейного программирования (SPDLR).

Приложения править

Полуопределённое программирование было использовано для поиска приближённых решений задач комбинаторной оптимизации, таких как решение задачи максимального разреза c аппроксимационным коэффициентом 0,87856. Задачи SDP используется также в геометрии для определения тенсегрити-графов, и появляются в теории управления как линейные матричные неравенства.

Литература править

Lieven Vandenberghe, Stephen Boyd. Semidefinite Programming // SIAM Review 38. — 1996. — Март. — С. 49—95.
Monique Laurent, Franz Rendl. Semidefinite Programming and Integer Programming/Report PNA-R0210, CWI, Amsterdam. — 2002. — Апрель.
E. de Klerk. Aspects of Semidefinite Programming: Interior Point Algorithms and Selected Applications. — Kluwer Academic Publishers, 2002. — ISBN 1-4020-0547-4.
P. Raghavendra. Optimal algorithms and inapproximability results for every CSP? // Proceedings of the 40th Annual ACM Symposium on theory of Computing (Victoria, British Columbia, Canada, May 17–20, 2008). STOC '08. — New York, NY: ACM, 2008. — С. 245-254.
Robert M. Freund. Introduction to Semidefinite Programming (SDP).
Michel X. Goemans, David P. Williamson. Improved approximation algorithms for maximum cut and satisfiability problems using semidefinite programming // JACM. — 1995. — Ноябрь (т. 42, вып. 6). — С. 1115—1145. — doi:10.1145/227683.227684.

Ссылки править

Links to introductions and events in the field
Lecture notes from László Lovász on Semidefinite Programming

[_162bc15258a75db1-1] Boyd, Vandenberghe, 1996.

[_b080f6af060b873c-2] Goemans, Williamson, 1995.

[_9d3498cfa14339ff-3] Raghavendra, 2008, с. 245-254.

[1]

[2]

[3]