Поправка на множественную проверку гипотез: различия между версиями

[отпатрулированная версия][отпатрулированная версия]
Содержимое удалено Содержимое добавлено
орфография
м Бот: замена устаревшего математического синтаксиса в соответствии с mw:Extension:Math/Roadmap
Строка 161:
== Применение в биоинформатике ==
Проблема множественного сравнения в биологии встречается повсеместно при анализе {{нп5|Омиксы|омиксных|en|Omics}}
данных<ref name=":0" /><ref>{{Статья|автор=Anjana Grandhi, Wenge Guo, Shyamal D. Peddada|год=2016-02-25|doi=10.1186/s12859-016-0937-5|issn=1471-2105|издание=BMC Bioinformatics|заглавие=A multiple testing procedure for multi-dimensional pairwise comparisons with application to gene expression studies|ссылка=https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4768411/|том=17}}</ref><ref>{{Cite web|url=https://www.sciencedirect.com/science/article/pii/S0165993613001246?via%3Dihub|title=ScienceDirect|publisher=www.sciencedirect.com|accessdate=2019-04-13}}</ref>, так как одновременно происходит анализ множества переменных. Так, в [[Полногеномный поиск ассоциаций|полногеномных исследованиях ассоциаций]] и [[Количественный анализ экспрессии генов|анализе дифференциальной экспрессии]] генов тестируется одновременно от сотен тысяч до миллионов гипотез. В большинстве случаев используется поправка Бонферрони или общепринятый для GWAS порог p-value <math>5\cdot10^{-8}</math><ref>{{Статья|автор=Gregory S. Barsh, Gregory P. Copenhaver, Greg Gibson, Scott M. Williams|год=2012-07-05|doi=10.1371/journal.pgen.1002812|issn=1553-7390|выпуск=7|издание=PLoS Genetics|заглавие=Guidelines for Genome-Wide Association Studies|ссылка=https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3390399/|том=8}}</ref>, однако при этом происходит падение мощности исследования с сопутствующим ростом риска ложно-отрицательных результатов. Также нарушается предположение поправки Бонферрони о независимости проводимых сравнений, поскольку существует [[неравновесное сцепление генов]], когда частоты сочетаний [[SNP]] отличаются от ожидаемых при условии отсутствия сцепления, поэтому встает вопрос, сколько проведено реальных независимых сравнений. Можно определить число независимых сравнений в таких условиях как число [[Метод главных компонент|главных компонент]], совокупно покрывающих более <math>99,5\%</math> дисперсии исследуемых данных, тогда порог p-value, обеспечивающий статистическую значимость на уровне <math>\alpha</math>, пересчитывается следующим образом:
 
<math>\alpha_{GWAS} = \frac{\alpha}{n_{components}}</math><ref name=":1">{{Статья|автор=Randall C Johnson, George W Nelson, Jennifer L Troyer, James A Lautenberger, Bailey D Kessing|год=2010-12-22|doi=10.1186/1471-2164-11-724|issn=1471-2164|страницы=724|издание=BMC Genomics|заглавие=Accounting for multiple comparisons in a genome-wide association study (GWAS)|ссылка=https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3023815/|том=11}}</ref><ref>{{Статья|автор=Xiaoyi Gao, Joshua Starmer, Eden R. Martin|год=2008-5|doi=10.1002/gepi.20310|issn=0741-0395|выпуск=4|страницы=361—369|издание=Genetic Epidemiology|заглавие=A multiple testing correction method for genetic association studies using correlated single nucleotide polymorphisms|ссылка=https://www.ncbi.nlm.nih.gov/pubmed/18271029/|том=32}}</ref>