Модель бинарного выбора: различия между версиями

[отпатрулированная версия][отпатрулированная версия]
Содержимое удалено Содержимое добавлено
Строка 31:
 
==Оценка параметров==
 
Оценка обычно производится [[метод максимального правдоподобия|методом максимального правдоподобия]]. Пусть имеется [[выборка]] объёма <math>n</math> факторов <math>X</math> и зависимой переменной <math>Y</math>. Для данного номера наблюдения используем индекс <math>t</math>. Вероятность получения в наблюдении <math>t</math> значения <math>y_t</math> можно смоделировать следующим образом:
 
: <math>P(Y=y_t) = p^{y_t}(x_t)(1-p(x_t))^{1-y_t} = (1-F(-x^T_tb))^{y_t}F^{1-y_t}(-x^T_tb)</math>
 
В самом деле, если <math>y_t=1</math>, то второй множитель очевидно равен 1, а первый как раз <math>p(x_t)</math>, если же <math>y_t=0</math>, то первый множитель равен единице, а второй — <math>(1-p(x_t))</math>. Предполагается, что данные независимы. Поэтому [[функция правдоподобия|функцию правдоподобия]] можно получить как произведение вышеуказанных вероятностей:
 
: <math>L(b)=\prod^n_{t=1} (1-F(-x^T_tb))^{y_t}F^{1-y_t}(-x^T_tb)</math>
 
Соответственно [[функция правдоподобия#Логарифмическая функция правдоподобия|логарифмическая функция правдоподобия]] имеет вид:
 
: <math> l(b)=\sum^n_{t=1} y_t \ln (1-F(-x^T_tb))+(1-y_t)\ln F(-x^T_tb)</math>
 
Максимизация данной функции по неизвестным параметрам позволяет получить [[состоятельная оценка|состоятельные]], [[асимптотически эффективная оценка|асимптотически эффективные]] и [[асимптотически нормальная оценка|асимптотически нормальные]] оценки параметров. Последнее означает, что:
 
: <math>\sqrt{n}(\hat b - b)\ \xrightarrow{d}\ \mathcal{N}(0,\,\Omega^{-1}),</math>
 
где <math>\Omega^{-1}</math> — асимптотическая [[ковариационная матрица]] оценок параметров, которая определяется стандартным для метода максимального правдоподобия способом (через [[гессиан функции|гессиан]] или [[градиент]] логарифмической функции правдоподобия в оптимальной точке):
 
: <math>\Omega = \operatorname{E}\bigg[ \frac{\varphi^2(X'b)}{\Phi(X'b)(1-\Phi(X'b))}XX' \bigg] </math>,
где <math>\varphi</math> — [[функция плотности вероятности]] (''PDF'') стандартного [[нормальное распределение|нормального распределения]].
 
Матрица <math>\Omega</math> неизвестна и используется её [[состоятельная оценка]]:
 
: <math>\hat{\Omega} =\frac{1}{n} \sum^n_{t=1}\bigg[ \frac{\varphi^2(x^T_tb)}{\Phi(x^T_tb)(1-\Phi(x^T_tb))}x_tx^T_t \bigg] </math>
 
Обычно оценка модели производится в специализированных (статистических, [[эконометрика|эконометрических]]) программных продуктах, например, [[Statistica]], EViews, Matrixer, [[R (язык программирования)|R]]<ref>[http://www.ats.ucla.edu/stat/R/dae/probit.htm R Data Analysis Examples — Probit Regression]</ref>, PSPP и др.<ref>[[:en:Comparison_of_statistical_packages#Regression]]</ref>, хотя возможна «ручная» оценка, например в MS Office Excel, используя встроенный «Поиск решения» для максимизации логарифмической функции правдоподобия.
 
 
[[Категория:Эконометрика]]