Смещение вследствие пропущенных переменных

Смещение вследствие пропущенных переменных (англ. Omitted variable bias) — явление в регрессионном анализе, связанное с получением, смещённых и несостоятельных оценок регрессионных коэффициентов вследствие некорректной спецификации модели, а именно невключения в оцениваемую модель независимых переменных, оказывающих причинно-следственное влияние на зависимую переменную, или невозможности включить в неё некую ненаблюдаемую независимую переменную.

Формальный вывод

править

Представим, что истинная регрессионная модель выглядит следующим образом:

 

где   — вектор отклика,   и   — матрица и вектор независимых переменных. При условии, что   и  , то оценки   и   соответственно будут МНК-оценками регрессионной зависимости отклика от независимых переменных. В частности,   (где   — объединённая матрица независимых переменных).

Чтобы смоделировать смещение вследствие пропущенных переменных, опустим предиктор  , включив его в состав нескоррелированной с   части модели:

  где  .

Тогда МНК-оценки коэффициентов при предикторах будут несостоятельны в сравнении с истинным коэффициентом  :

 

Поскольку, согласно допущению изначальной модели,  , то  , тогда как

  откуда  .

Литература

править
  • Cameron A. C., Trivedi P. K. Microeconometrics: methods and applications. – Cambridge university press, 2005. — 1034 p. — P. 92-93.
  • Wooldridge J. M. Introductory Econometrics: A Modern Approach. – South-Western College Pub, 2002. — 819 p. — P. 87-92, 165-166.