Clustal

(перенаправлено с «ClustalW»)

Clustal (англ. Cluster alignment) — одна из самых широко используемых компьютерных программ для множественного выравнивания нуклеотидных и аминокислотных последовательностей[1].

Clustal Omega
Скриншот программы Clustal Omega
Тип Биоинформатика
Автор Desmond G. Higgins[d]
Разработчики Des Higgins, Fabian Sievers, David Dineen и Andreas Wilm (Conway Institute, UCD)
Написана на C++
Операционные системы UNIX, Linux, Mac, Windows
Последняя версия 1.2.2 (1.07.2016)
Лицензия GNU GPL 2
Сайт clustal.org/omega/
ClustalW/ClustalX
Скриншот программы ClustalW/ClustalX
Тип Биоинформатика
Автор Desmond G. Higgins[d]
Разработчики Gibson T. (EMBL), Thompson J. (CNRS), Higgins D. (UCD)
Написана на C++
Операционные системы UNIX, Linux, Mac, Windows
Последняя версия 2.1 (17.11.2010)
Лицензия GNU GPL 2
Сайт clustal.org

Clustal использует метод попарного прогрессивного выравнивания.

Программа представлена в трех версиях:

  • ClustalW — с интерфейсом командной строки[2].
  • ClustalX — с графическим интерфейсом[3].
  • Clustal Omega — более современная версия программы, позволяющая выравнивать сотни последовательностей в течение нескольких часов и являющаяся одной из наиболее эффективных программ для множественного выравнивания по данным тестов производительности[4]. В этой разновидности используется только интерфейс командной строки.

Несмотря на то что ClustalW и ClustalX не были первыми инструментами для множественного выравнивания, они получили широкое распространение благодаря своей широкой доступности для персональных компьютеров и интуитивно понятному пользовательскому интерфейсу.

Clustal Omega править

Все современные версии Clustal базируются на Clustal Omega (ClustalΩ). Clustal Omega предоставила новую систему оценки нуклеотидных последовательностей: сначала программа выравнивает наиболее схожие последовательности, постепенно переходя к наименее схожим, тем самым создавая глобальное выравнивание. Для проведения глобального выравнивания в этой программе необходимо иметь минимум три последовательности, для парного выравнивания можно использовать EMBOSS[en] или LALIGN[5].

Алгоритм править

Сначала ClustalΩ рассчитывает приблизительную матрицу расстояний одним из двух методов:

  • быстрый метод, который считает совпадение пар аминокислотных остатков или коротких нуклеотидных фрагментов (2-4 основания);
  • классический алгоритм попарного выравнивания последовательностей с аффинными штрафами за пропуски.

Затем методом присоединения соседей строится направляющее дерево, на котором и будет построена глобальная сеть выравниваний. Дерево укореняется методом средней точки (mid-point)[6].

Хотя другие программы для множественного выравнивания, основанные на методе согласованности (Probcons, T-Coffee, Probalign и MAFFT), превосходят по точности Clustal Omega, они используют больше оперативной памяти и медленнее чем Clustal[7].

Clustal 2 (ClustalW/ ClustalX) править

ClustalX — это версия ClustalW с графическим интерфейсом. В данном обновлении не было новых функций, однако были обновлены и улучшены старые версии, описанные выше.

ClustalX используется для следующих функций[8]:

  • выполнить множественное выравнивание последовательностей;
  • посмотреть на результаты выравнивания;
  • внести правки, если это необходимо.

ClustalX, как и ClustalW, скомпилирована для загрузки на всех операционных системах: Linux, Mac OS X, Windows (как XP, так и Vista). Предыдущие версии по-прежнему доступны для загрузки на сайте.

Примечания править

  1. Frédéric Dardel, François Képès. Bioinformatics: Genomics and Post-Genomics. Wiley. 2006. p.54
  2. Larkin M.A., Blackshields G., Brown N.P., Chenna R., McGettigan P.A., McWilliam H., Valentin F., Wallace I.M., Wilm A., Lopez R., Thompson J.D., Gibson T.J., Higgins D.G. ClustalW and ClustalX version 2 (неопр.) // Bioinformatics. — 2007. — Т. 23, № 21. — С. 2947—2948. — doi:10.1093/bioinformatics/btm404. — PMID 17846036.
  3. Thompson J.D., Gibson T.J., Plewniak F., Jeanmougin F., Higgins D.G. The CLUSTAL_X windows interface: flexible strategies for multiple sequence alignment aided by quality analysis tools (англ.) // Nucleic Acids Research  (англ.) : journal. — 1997. — Vol. 25, no. 24. — P. 4876—4882. — doi:10.1093/nar/25.24.4876. — PMID 9396791. — PMC 147148.
  4. Sievers F., Wilm A., Dineen D.G., Gibson T.J., Karplus K., Li W., Lopez R., McWilliam H., Remmert M., Söding J., Thompson J.D., Higgins D.G. Fast, scalable generation of high-quality protein multiple sequence alignments using Clustal Omega (англ.) // Mol Syst Biol 7 : journal. — 2011. — Vol. 7, no. 539. — doi:10.1038/msb.2011.75.
  5. LALIGN. Дата обращения: 7 июня 2021. Архивировано 24 мая 2021 года.
  6. Григорий Мавропуло-Столяренко, Александр Тулуб, Василий Стефанов. Биоинформатика. Учебник для академического бакалавриата. — Litres, 2021-04-01. — 253 с. — ISBN 978-5-04-028650-8. Архивировано 7 июня 2021 года.
  7. Fabiano Sviatopolk-Mirsky Pais, Patrícia de Cássia Ruy, Guilherme Oliveira, Roney Santos Coimbra. Assessing the efficiency of multiple sequence alignment programs // Algorithms for Molecular Biology : AMB. — 2014-03-06. — Т. 9. — С. 4. — ISSN 1748-7188. — doi:10.1186/1748-7188-9-4. Архивировано 20 мая 2014 года.
  8. Clustal X (амер. англ.). Evolution and Genomics. Дата обращения: 6 июня 2021. Архивировано 7 июня 2021 года.

Ссылки править