Панельные данные

Панельные данные[1][2], или лонгитюдные данные[2] — используемые в социальных науках и эконометрике многомерные данные, получаемые серией измерений или наблюдений за несколько периодов времени для одних и тех же компаний или людей. Исследование, в котором используются панельные данные, называется панельным исследованием.

ПримерПравить

Сбалансированная панель
Человек Год Доход Возраст Пол
№ 1 2016 1300 27 1
№ 1 2017 1600 28 1
№ 1 2018 2000 29 1
№ 2 2016 2000 38 2
№ 2 2017 2300 39 2
№ 2 2018 2400 40 2
Несбалансированная панель
Человек Год Доход Возраст Пол
№ 1 2016 1600 23 1
№ 1 2017 1500 24 1
№ 2 2016 1900 41 2
№ 2 2017 2000 42 2
№ 2 2018 2100 43 2
№ 3 2017 3300 34 1

В приведенном примере показаны два набора данных, собранные в панельную структуру. Индивидуальные характеристики (доход, возраст, пол) собираются для разных людей и разных лет. В первом наборе данных два человека (№ 1, № 2) наблюдаются каждый год в течение трех лет (2016, 2017, 2018). Во втором наборе данных три человека (№ 1, № 2, № 3) наблюдаются два раза (человек № 1), три раза (человек № 2) и один раз (человек № 3), соответственно, за три года (2016, 2017, 2018); в частности, для человека № 1 отсутствуют данные по 2018 году, а для человек № 3 — по 2016 и 2018 году.

Сбалансированная панель[3] (первый пример) представляет собой набор данных, в котором каждый член группы (то есть человек) наблюдается каждый год. Следовательно, если сбалансированная панель содержит N единиц наблюдения и Т периодов, число наблюдений (n) в наборе данных обязательно составит п = N × T[4].

Несбалансированная панель[3] (второй набор данных в примере) представляет собой набор данных, в котором, по меньшей мере, один член группы не имеет данных по всем периодам. Поэтому, если несбалансированная панель содержит N единиц наблюдения и Т периодов, то число наблюдений (n) в наборе данных строго меньше их произведения: п < N × T[4].

Оба набора данных структурированы в длинном формате, в котором одна строка содержит одно наблюдение за один раз. Другим способом структурирования панельных данных является широкий формат, где одна строка представляет одну единицу наблюдения для всех моментов времени[5] (например, в широком формате будет только две (первый пример) или три (второй пример) строки данных, с дополнительными столбцами для каждой переменной времени (доход, возраст).

ПримечанияПравить

  1. Ратникова Т. А. Введение в экономический анализ панельных данных // Экономический журнал ВЭШ. — 2006. — № 2. — С. 267-316. Архивировано 21 января 2022 года.
  2. 1 2 Денисова И. А. Выход старших возрастных когорт с рынка труда: анализ методами дожития // Население и экономика.. — 2017. — Т. 1, № 1. — С. 22-49.
  3. 1 2 Грин У. Г. Эконометрический анализ / перевод с английского под научной редакцией С. С. Синельникова и М. Ю. Турунцевой. — Москва: Издательский дом «Дело» РАНХиГС, 2016. — Т. 1. — С. 423. — 760 с.
  4. 1 2 Panel Data Econometrics: Theory (англ.) / edited by Tsionas M.. — Academic Press (an imprint of Elsevier), 2019. — P. 348. — 432 p.
  5. Andreß H.-J., Golsch K., Schmidt A. W. Applied Panel Data Analysis for Economic and Social Surveys (англ.). — Springer Science & Business Media, 2013. — P. 28. — 327 p.

ЛитератураПравить

  • Baltagi, Badi H. (2008). Econometric Analysis of Panel Data (Fourth ed.). Chichester: John Wiley & Sons. ISBN 978-0-470-51886-1.
  • Davies, A.; Lahiri, K. (1995). A New Framework for Testing Rationality and Measuring Aggregate Shocks Using Panel Data // Journal of Econometrics. 68 (1): 205–227. doi:10.1016/0304-4076(94)01649-K.
  • Davies, A.; Lahiri, K. (2000). "Re-examining the Rational Expectations Hypothesis Using Panel Data on Multi-Period Forecasts". Analysis of Panels and Limited Dependent Variable Models. Cambridge: Cambridge University Press. pp. 226–254. ISBN 0-521-63169-6.
  • Diggle, Peter J.; Heagerty, Patrick; Liang, Kung-Yee; Zeger, Scott L. (2002). Analysis of Longitudinal Data (2nd ed.). Oxford University Press. p. 2. ISBN 0-19-852484-6.
  • Frees, E. (2004). Longitudinal and Panel Data: Analysis and Applications in the Social Sciences. New York: Cambridge University Press. ISBN 0-521-82828-7.
  • Hsiao, Cheng (2003). Analysis of Panel Data (Second ed.). New York: Cambridge University Press. ISBN 0-521-52271-4.
  • Fitzmaurice, Garrett M.; Laird, Nan M.; Ware, James H. (2004). Applied Longitudinal Analysis. Hoboken: John Wiley & Sons. p. 2. ISBN 0-471-21487-6.