Вычислительная геномика

Вычисли́тельная гено́мика использует вычислительный анализ, чтобы расшифровать последовательности генома и связанные с ними данные^[1], включая последовательности ДНК и РНК. Также вычислительная геномика может быть определена как раздел биоинформатики, но с тем отличием, что внимание уделяется анализу полных геномов (а не отдельных генов), чтобы понять принципы того, как различные ДНК управляют организмом на молекулярном уровне^[2].

История править

Вычислительная геномика начала своё развитие одновременно с биоинформатикой. В 1960-х годах Маргарет Дейхофф и другие в Национальном Биомедицинском Исследовательский фонде создали базы данных различных последовательностей белков для эволюционного исследования ^[3]. В их исследовании строилось филогенетическое дерево, которое определило изменения, требующиеся для определенного белка, чтобы эволюционировать в другой белок. Это привело к созданию матрицы замен, которая оценивает вероятность связи одного белка с другим.

Начиная с 1980-х годов, стали появляться базы данных с геномными последовательностями, но при этом возникли новые проблемы при поиске и сравнении данных об отдельных генах. В отличие от алгоритмов поиска текстов, которые используются на веб-сайтах, при поиске генетического сходства необходимо выявлять последовательности, которые не обязательно идентичны, но и просто схожи. Это привело к появлению алгоритма Нидлмана — Вунша, который является алгоритмом динамического программирования для того, чтобы сравнить наборы последовательностей аминокислот друг с другом при использовании матриц замен, полученных в более раннем исследовании М.Дейхофф. Позже появился алгоритм BLAST, который позволяет осуществлять быстрый и оптимизированный поиск в базах данных последовательностей генов. BLAST и его модификации - одни из наиболее широко используемых алгоритмов для этой цели ^[4]. Во многих алгоритмах локального выравнивания последовательностей используется алгоритм Смита-Ватермана. Он помогает сравнивать последовательности в небольших локусах. В нём также используются матрицы замен, а также бэктрекинг.

Появление фразы "вычислительная геномика" совпадает с появлением полных аннотированных геномов во второй половине 1990-х годов. Первая ежегодная конференции по вопросам вычислительной геномики была организована учеными из Института геномных исследований (TIGR) в 1998, обеспечивая форум для этой специальности и эффективно отличая эту область науки от более общих областей геномики или вычислительной биологии ^[5]^[6]. Впервые в научной литературе этот термин, согласно MEDLINE, был использован одним годом ранее (в журнале Nucleic Acids Research ^[7]).

Примечания править

↑ Koonin EV (2001) Computational Genomics, National Center for Biotechnology Information, National Library of Medicine, NIH (PubMed ID: 11267880)
↑ Computational Genomics and Proteomics at MIT (неопр.). Дата обращения: 13 декабря 2010. Архивировано из оригинала 22 марта 2018 года.
↑ David Mount (2000), Bioinformatics, Sequence and Genome Analysis, pp. 2-3, Cold Spring Harbor Laboratory Press, ISBN 0-87969-597-8
↑ T.A. Brown (1999), Genomes, John Wiley & Sons, ISBN 0-471-31618-0
↑ [backPid]=67&cHash=fd69079f5e [https://web.archive.org/web/20170107160058/http://www.jcvi.org/cms/press/press-releases/full-text/archive/2004//article/computational-genomics-conference-to-attract-leading-scientists/?tx_ttnews[backPid]=67&cHash=fd69079f5e Архивная копия от 7 января 2017 на Wayback Machine The 7th Annual Conference on Computational Genomics (2004)]
↑ The 9th Annual Conference on Computational Genomics (2006) Архивировано 12 февраля 2007 года.
↑ A. Wagner (1997), A computational genomics approach to the identification of gene networks, Nucleic Acids Res., Sep 15;25(18):3594-604, ISSN 0305-1048

[1] Koonin EV (2001) Computational Genomics, National Center for Biotechnology Information, National Library of Medicine, NIH (PubMed ID: 11267880)

[MIT-2] Computational Genomics and Proteomics at MIT (неопр.). Дата обращения: 13 декабря 2010. Архивировано из оригинала 22 марта 2018 года.

[3] David Mount (2000), Bioinformatics, Sequence and Genome Analysis, pp. 2-3, Cold Spring Harbor Laboratory Press, ISBN 0-87969-597-8

[4] T.A. Brown (1999), Genomes, John Wiley & Sons, ISBN 0-471-31618-0

[5] [backPid]=67&cHash=fd69079f5e [https://web.archive.org/web/20170107160058/http://www.jcvi.org/cms/press/press-releases/full-text/archive/2004//article/computational-genomics-conference-to-attract-leading-scientists/?tx_ttnews[backPid]=67&cHash=fd69079f5e Архивная копия от 7 января 2017 на Wayback Machine The 7th Annual Conference on Computational Genomics (2004)]

[6] The 9th Annual Conference on Computational Genomics (2006) Архивировано 12 февраля 2007 года.

[7] A. Wagner (1997), A computational genomics approach to the identification of gene networks, Nucleic Acids Res., Sep 15;25(18):3594-604, ISSN 0305-1048

[1]

[2]

[3]

[4]

[5]

[6]

[7]