Парадокс Симпсона: различия между версиями

[непроверенная версия][непроверенная версия]
Содержимое удалено Содержимое добавлено
→‎Причины: ссылка на статью о репрезентативности
→‎Практическая значимость: Исправлены округления
Строка 104:
Соотношение в агрегированных данных 850/870<480/410, то есть 0,977<1,171. Следовательно, доля выздоровевших среди принимавших лекарство меньше той же доли среди не принимавших.
 
ОднакоДля устранения парадокса, нужно обратить внимание, что отношение контрольной группы к группе воздействия в приведённых данныхгруппах резко различается: у мужчин составляет (80+13)/(700+800) = 6,2%, а у женщин (400+280)/(150+70) = 309%.
 
Для корректного усреднения, нужно обеспечить репрезентативность контрольной группы в обеих выборках, введя весовые коэффициенты так, чтобы взвешенная доля контрольных в обеих группах стала одинаковой. В данном случае, достаточно весколичество мужчин, не принимавших лекарства, увеличитьумножить вна 50весовой разкоэффициент 49.85. Измененные таблицы будут выглядеть так:
 
{| class="wikitable"
Строка 114:
|-
| Выздоровевшие || 700 || 80
|3988
|4000
|-
| Невыздоровевшие || 800 || 130
|6480.5
|6500
|-
| Соотношение || 0.875 || 0.615
Строка 130:
|-
| Выздоровевшие || 850 || 480
|4388
|4400
|-
| Невыздоровевшие || 870 || 410
|6760.5
|6780
|-
| Соотношение || 0.977 || 1.171
Строка 139:
|}
 
Соотношение взвешенного количества выздоровевших к не выздоровевшим среди не принимавших лекарство в этом случае составит 0,649, то есть ниже, чем у принимавших лекарство,. чтоЭто устраняет парадокс и показывает отношение выздоровевших к не выздоровевшим без приема лекарства для такой же пропорции мужчин и женщин, как у принимавших лекарство, что позволяет сравнивать эти цифры.
 
== См. также ==