Марковский момент

(перенаправлено с «Оптимальная остановка»)

В математике теория момента остановки или марковский момент времени связана с проблемой выбора времени, чтобы принять определённое действие, для того чтобы максимизировать ожидаемое вознаграждение или минимизировать ожидаемые затраты. Проблема момента остановки может быть найдена в области статистики, экономики и финансовой математики (связанные с ценообразованием на американские опционы). Самым ярким примером, относящимся к моменту остановки, является Задача о разборчивой невесте. Проблема момента остановки часто может быть указана в форме уравнения Беллмана и поэтому часто решается с помощью динамического программирования.

Определение править

Случай с дискретным временем править

Как правило, проблема момента остановки связана с двумя объектами:

  1. Последовательность случайных величин  , чьё совместное распределение предполагается известным.
  2. Последовательность «вознаграждающих» функций   которые зависят от наблюдаемых значений случайных величин в 1:
     

С учетом этих объектов, проблема заключается в следующем:

  • Вы, соблюдая последовательность случайных величин, на каждом шаге   можете выбрать прекратить или продолжить наблюдение.
  • Если вы прекратите наблюдать на шаге  , вы получите награду  .
  • Вам нужно выбрать правило остановки, чтобы максимизировать предполагаемое вознаграждение (или, что эквивалентно, минимизировать ожидаемую потерю).

Случай непрерывного времени править

Рассмотрим усиление процессов   определённых на фильтрованном вероятностном пространстве   и предположим, что   это адаптирование фильтрации. Задача момента остановки состоит в том, чтобы найти время остановки   которое максимизирует ожидаемый выигрыш:

 

где   называется значением функции. Здесь   может иметь значение  .

Более конкретная формулировка выглядит следующим образом. Мы рассматриваем адаптированный сильный Марковский процесс  , определённый на фильтрованном вероятностном пространстве  , где   обозначает вероятностную меру, при которой случайный процесс начинается с  . Учитывая непрерывные функции   и  , задача оптимальной остановки:

 

Иногда это называется МЛС (Майер, Лагранж и супремум, соответственно) формулировка.[1]

Методы решения править

Есть два подхода к решению проблемы момента остановки. Когда основной процесс (или усиление процесса) описывается своим безусловным конечномерным распределением, тогда соответствующий метод решения — подход Мартингала, названный так потому, что он использует теорию Мартингала, наиболее важным понятием является разработка Снелла. В дискретном случае, если горизонт планирования   конечен, проблема может быть легко решена с помощью динамического программирования.

Когда основной процесс определяется семейством (условных) функций переходов приводящих к Марковскому семейству вероятностных переходов, часто могут быть использованы мощные аналитические инструменты теории Марковских процессов и такой подход называется Марковским методом. Решение обычно получается путём решения связанных задач со свободными границами (задачи Стефана).

Результат диффузии прыжка править

Пусть   будет диффузия Леви в   из стохастического дифференциального уравнения

 

где   —  -мерное Броуновское движение,   это  -мерная компенсированная случайная мера Пуассона,  ,  , и   заданы такие функции, что существует единственное решение  . Пусть   будет открытым множеством (область платежеспособности) и

 

время банкротства. Задача оптимальной остановки:

 

Получается, что при некоторых условиях регулярности,[2] выполняется следующая теорема проверки:

Если функция   удовлетворяет

  •   где область продолжения  ,
  •   на  , и
  •   на  , где   — бесконечно малый генератор  

тогда   для всех  . Кроме того, если

  •   на  

Тогда   для всех   и   — оптимальный момент остановки.

Эти условия могут быть записаны в более компактной форме (интегро-вариационное неравенство):

  •   на  

Примеры править

Подбрасывание монеты править

(Пример, где   сходится)

У вас есть честная монета, и вы постоянно подбрасываете её. Каждый раз, перед броском, вы можете остановить бросок и получить оплату (скажем, в долларах) за среднее количество выпавших орлов.

Вы хотите максимизировать сумму, которую вам заплатят, выбирая правило остановки. Если хi (где i ≥ 1) образует последовательность независимых, одинаково распределённых случайных величин с распределением Бернулли

 

и если

 

тогда последовательности   и   являются объектами, связанными с этой проблемой.

Продажа дома править

(Пример, где   не обязательно сходится)

У вас есть дом, и вы хотите продать его. Каждый день вам предлагают   за ваш дом, и платите  , чтобы продолжать рекламировать его. Если вы продадите ваш дом в день  , вы заработаете  , где  .

Вы хотите максимизировать сумму, которую вы зарабатываете, выбирая правило остановки.

В этом примере последовательности ( ) является последовательностью предложений за ваш дом, а последовательность «вознаграждений» функций определяет, сколько вы будете зарабатывать.

Задача о разборчивой невесте править

(Пример, где   — это конечная последовательность)

Рассматривается последовательность объектов, которые можно отсортировать от лучшего к худшему. Вы хотите выбрать правило остановки, которое максимизирует ваши шансы на выбор лучшего объекта.

Здесь, если   (n - некоторое большое число) — ранги объектов, и   — это шанс, что вы выберете лучший объект, если прекратите намеренно отбрасывать объекты на шаге i, то   и   — последовательности, связанные с этой проблемой. Эта задача была решена в начале 1960-х годов. Изящное решение задачи секретаря и несколько модификаций этой задачи обеспечивают более современный алгоритм оптимальной остановки (алгоритм Брюса).

Теория поиска править

Экономисты изучили ряд проблем оптимального момента остановки, подобных «задаче секретаря», и обычно называют этот тип анализа «теорией поиска». Теория поиска особенно сосредоточена на поиске работником высокооплачиваемой работы или поиске потребителем продукции по низкой цене.

Торговля опционами править

В торговле опционами на финансовых рынках, держатель американского опциона может осуществлять право купить (или продать) базовый актив по определённой цене в любое время до или в момент истечения срока. Таким образом, оценка американских опционов, по сути, проблема оптимальной остановки. Рассмотрим классическую модель Блэка-Шоулза и пусть   будет безрисковой процентной ставкой   и   ставка дивидендов и непостоянство акции. Цена акций   следует за геометрическим броуновским движением

 

В соответствии с мерой риска.

Когда параметр является бессрочным, задача оптимальной остановки

 ,

где функция выигрыша   для опциона вызова и   для опциона ставки. Вариационное неравенство

 

для всех   где   это граница физических упражнений. Решение известно[3]

  • (Бесконечный вызов)   где   и  
  • (Бесконечная ставка)   где   и  

С другой стороны, когда конечный срок действия конечен, задача связана с двумерной задачей о свободной границе без известного решения замкнутой формы. Однако могут быть использованы различные численные методы. См. Модель Black-Scholes # Американские опционы для различных методов оценки здесь, а также Fugit для дискретного дерева на основе расчета оптимального времени для тренировки.

См. также править

Ссылки править

  1. Peskir, Goran; Shiryaev, Albert[англ.]. Optimal Stopping and Free-Boundary Problems (неопр.). — 2006. — Т. Lectures in Mathematics. ETH Zürich. — ISBN 978-3-7643-2419-3. — doi:10.1007/978-3-7643-7390-0.
  2. Øksendal, B.[англ.]; Sulem, A. S. Applied Stochastic Control of Jump Diffusions (неопр.). — 2007. — ISBN 978-3-540-69825-8. — doi:10.1007/978-3-540-69826-5.
  3. Karatzas, Ioannis; Shreve, Steven E.[англ.]. Methods of Mathematical Finance (неопр.). — 1998. — Т. 39. — ISBN 978-0-387-94839-3. — doi:10.1007/b98840.