Вычислительная геномика

Вычисли́тельная гено́мика использует вычислительный анализ, чтобы расшифровать последовательности генома и связанные с ними данные[1], включая последовательности ДНК и РНК. Также вычислительная геномика может быть определена как раздел биоинформатики, но с тем отличием, что внимание уделяется анализу полных геномов (а не отдельных генов), чтобы понять принципы того, как различные ДНК управляют организмом на молекулярном уровне[2].

История править

Вычислительная геномика начала своё развитие одновременно с биоинформатикой. В 1960-х годах Маргарет Дейхофф и другие в Национальном Биомедицинском Исследовательский фонде создали базы данных различных последовательностей белков для эволюционного исследования [3]. В их исследовании строилось филогенетическое дерево, которое определило изменения, требующиеся для определенного белка, чтобы эволюционировать в другой белок. Это привело к созданию матрицы замен, которая оценивает вероятность связи одного белка с другим.

Начиная с 1980-х годов, стали появляться базы данных с геномными последовательностями, но при этом возникли новые проблемы при поиске и сравнении данных об отдельных генах. В отличие от алгоритмов поиска текстов, которые используются на веб-сайтах, при поиске генетического сходства необходимо выявлять последовательности, которые не обязательно идентичны, но и просто схожи. Это привело к появлению алгоритма Нидлмана — Вунша, который является алгоритмом динамического программирования для того, чтобы сравнить наборы последовательностей аминокислот друг с другом при использовании матриц замен, полученных в более раннем исследовании М.Дейхофф. Позже появился алгоритм BLAST, который позволяет осуществлять быстрый и оптимизированный поиск в базах данных последовательностей генов. BLAST и его модификации - одни из наиболее широко используемых алгоритмов для этой цели [4]. Во многих алгоритмах локального выравнивания последовательностей используется алгоритм Смита-Ватермана. Он помогает сравнивать последовательности в небольших локусах. В нём также используются матрицы замен, а также бэктрекинг.

Появление фразы "вычислительная геномика" совпадает с появлением полных аннотированных геномов во второй половине 1990-х годов. Первая ежегодная конференции по вопросам вычислительной геномики была организована учеными из Института геномных исследований (TIGR) в 1998, обеспечивая форум для этой специальности и эффективно отличая эту область науки от более общих областей геномики или вычислительной биологии [5][6]. Впервые в научной литературе этот термин, согласно MEDLINE, был использован одним годом ранее (в журнале Nucleic Acids Research [7]).

Примечания править

  1. Koonin EV (2001) Computational Genomics, National Center for Biotechnology Information, National Library of Medicine, NIH (PubMed ID: 11267880)
  2. Computational Genomics and Proteomics at MIT. Дата обращения: 13 декабря 2010. Архивировано из оригинала 22 марта 2018 года.
  3. David Mount (2000), Bioinformatics, Sequence and Genome Analysis, pp. 2-3, Cold Spring Harbor Laboratory Press, ISBN 0-87969-597-8
  4. T.A. Brown (1999), Genomes, John Wiley & Sons, ISBN 0-471-31618-0
  5. [backPid]=67&cHash=fd69079f5e [https://web.archive.org/web/20170107160058/http://www.jcvi.org/cms/press/press-releases/full-text/archive/2004//article/computational-genomics-conference-to-attract-leading-scientists/?tx_ttnews[backPid]=67&cHash=fd69079f5e Архивная копия от 7 января 2017 на Wayback Machine The 7th Annual Conference on Computational Genomics (2004)]
  6. The 9th Annual Conference on Computational Genomics (2006) Архивировано 12 февраля 2007 года.
  7. A. Wagner (1997), A computational genomics approach to the identification of gene networks, Nucleic Acids Res., Sep 15;25(18):3594-604, ISSN 0305-1048