Меню сайта


Компьютерный анализ генетических текстов.

Выявление и анализ закодированных в последовательностях функци­ональных сигналов требует применения современных методов информа­тики - качественных баз данных с современными средствами управле­ния, новейших методов распознавания образов, статистических иссле­дований, применения специальных алгоритмов для преодоления возни­кающих вычислительных трудностей.

В настоящее время исследование функциональных свойств расшифро­ванных последовательностей нуклеиновых кислот - это новый раздел молекулярной биологии, граничащий с информатикой, с одной стороны, и молекулярной биофизикой - с другой. Можно с уверенностью ска­зать, что в настоящее время анализ последовательности биополимера позволяет извлечь лишь очень небольшую долю закодированной в ней информации. В конечном счете точное выявление функциональных осо­бенностей в последовательностях нуклеиновых кислот будет возможно только после детального исследования соответствующих реакций, осу­ществляемых нуклеиновобелковыми комплексами.

Для оперативной работы с последовательностями создаются специ­альные банки данных. В банке в доступном для пользователя виде хранится каждая рас­шифрованная последовательность и ее паспорт, в котором указаны различные сведения о ней. Это сведения об организме, из которого выделена последовательность, о документе, где она описана, о рас­положении на ней регуляторных участков и белках, которые она кодирует и т.д. В настоящее время созданы три большие базы данных пос­ледовательностей нуклеиновых кислот: "Genbank" (Лос-Аламос, США - более 30 млн. нуклеотидов), база данных нуклеотидных последова­тельностей Европейской молекулярно-биологической лаборатории (EMBL, Гейдельберг, ФРГ - более 30 млн. нуклеотидов) и "Генэкспресс" (СССР, ВИНИТИ-ИМГ АН СССР - более 11 млн. нуклеотидов). Из­вестны также несколько белковых баз данных, наиболее представи­тельной из которой является MBRF-PIR (США). Эти базы данных расп­ространяются на различных носителях - магнитных лентах и дисках, на оптических дисках.

Кроме построения филогенетических древ геномов вирусов компьютерный анализ применяется при поиске гомологий, распознавании кодирующих областей, функциональных сигналов, физическом (рестрикционном) картировании молекул ДНК и для предсказания вторичных структур РНК.

Сейчас в мире создано большое количество программ ( обычно организованных в пакеты ) , предназначенных для анализа последовательностей нуклеиновых кислот и избавляющих исследователей от многих трудоёмких рутинных операций , в том числе: подсчёт числа моно -, ди – и тринуклеотидов, перевод нуклеотидной последовательности в аминокислотную и т.д.

Все программы условно делятся на два класса: общего назначе­ния и специального. Первые осуществляют ряд_ наиболее распростра­ненных операций по сбору и анализу последовательностей и позволя­ют: вводить и редактировать новые последовательности, считывать с помощью сканирующих устройств информацию непосредственно с ав­тографов или гелей', находить участки узнавания эндонуклеаз рестрик­ции и представлять результаты в удобном (табличном или графиче­ском) виде, находить участки с элементами поворотной и зеркальной симметрии (палиндромы), транслировать нуклеотидную последова­тельность в белковую во всех трех рамках считывания, сравнивать две последовательности методом точечных матриц гомологии, сравнивать новую последовательность со всеми данными Ген Банка, находить участки, обогащенные теми или иными нуклеотидами, вычислять гипотетическую температуру плавления ДНК, осуществлять автоматиче­скую сборку секвенированных фрагментов в единую структуру - моле­кулу ДНК, транслировать белковую последовательность в нуклеотидную с учетом неравномерности использования кодонов-синонимов, оп­ределять молекулярную массу НК и белков, предсказывать вторичную структуру белков, вычислять свободную энергию образования шпилек и др.

Перейти на страницу: 1 2 3