Method Article
Мы представляем общественности вычислительной веб-сайта для анализа геномных последовательностей. Он обнаруживает модели последовательности ДНК с различными неслучайный нуклеотидных композиций. Этот ресурс также генерирует рандомизированных последовательностей с различными уровнями сложности.
Некодирующих геномных регионов в сложных эукариотов, в том числе межгенных областях, интроны, и непереведенные сегменты экзонов, глубоко неслучайных в их нуклеотидного состава и состоят из сложную мозаику последовательность узоров. Эти модели включают так называемые Средний уровень неоднородности (МРТ) области - 30-10000 последовательности нуклеотидов в длину, которые обогащены частности базы или комбинации оснований (например, (G + T)-богатые, богатые пуринами и т.д. ). МРТ регионах связаны с необычными (не-B-форма) ДНК структур, которые часто участвуют в регуляции экспрессии генов, рекомбинации и другие генетические процессы (Федоровой и Федорова 2010). Существование сильной фиксации смещения магнитно-резонансных регионов против мутаций, которые приводят к снижению их последовательность неоднородности дополнительно поддерживает функциональность и важность этих геномных последовательностей (Пракаш и соавт. 2009).
Здесь мы показываем, свободно доступных Интернет-ресурса - Геномная МРТ пакет программ - (. Bechtel и др., 2008) предназначена для компьютерного анализа геномных последовательностей, чтобы найти и охарактеризовать различные модели МРТ в них. Этот пакет также позволяет получать рандомизированных последовательностей с различными свойствами и уровень соответствия естественных последовательностей ДНК вход. Основной целью данного ресурса является содействие рассмотрению обширные регионы некодирующих ДНК, которые все еще мало исследована и ждут тщательного исследования и признания.
Все используемые программы в статье, были написаны с использованием Perl, и все веб-страницы, созданные с помощью PHP.
1. Отправная точка:
Откройте домашнюю страницу интернет Геномная МРТ пакет в http://mco321125.meduohio.edu/ ~ jbechtel / gmri /. Веб-ресурс также содержит инструкции / разъяснения по программам в "Помощь (How-to/README)" ссылку, в то время как все опубликованные материалы по геномной МРТ и аналогичные алгоритмы перечислены в "Ссылки на соответствующие ресурсы" ссылку.
2. Подготовка и загрузка входных последовательностей (ы).
Создайте файл с FASTA формате последовательность (ы), чтобы начать сессию GMRI анализа. Каждый нуклеотидной последовательности в этом формате должно предшествовать с одной линии, начиная с символ ">", который представляет идентификатор, а затем на той же строке краткое описание этой последовательности. Нуклеотидные последовательности для анализа GMRI позволяет также символы, такие как R, Y, N, X и т.д. Hwever, не-А, Т, С, G символы не будут обработаны программой и будет пропущен. Последовательность, в которой повторяющиеся элементы были "в масках" (заменен на "N") может быть использован в качестве входных данных. Обратите внимание, что последовательность символов нечувствительны к регистру.
ПРИМЕЧАНИЕ: Отныне входных последовательностей, называются "UserFile".
3. Получить олигонуклеотидов Распределение Частота входных последовательностей (опция).
Нажмите на "НИИ Analyzer" вкладку (вверху), чтобы получить распределение частот для олигонуклеотида весь набор входных последовательностей. Акроним расшифровывается как НИИ ближнего неоднородности. На данном этапе пользователь может указать высокий длина олигонуклеотидов (от 2 до 9 нуклеотидов, по умолчанию 6 НТС), для которых частоты будут рассчитаны. Этот выбор сделан, нажав на нужную опцию в "Максимальный размер олигомер" списка. Затем нажмите кнопку "Analyze File" кнопку, чтобы начать вычисления. Грубые представления состава входной последовательности сразу появится в виде короткого таблице в середине этого веб-страницу и загрузить как "userfile.comp.tbl". Эта таблица представляет собой лишь наиболее и наименее распространены олигонуклеотидов в пределах входных последовательностей.
Всю таблицу частот для всех возможных олигонуклеотидов формируется в виде файла с именем "userfile.comp", которая может быть получена через "Скачать композицию файл" ссылку.
ПРИМЕЧАНИЕ: Шри-анализатор рассчитывает полный набор всех перекрывающихся олигонуклеотидов.
4. Генерация случайных последовательностей с тем же олигонуклеотидов Состав Как и в входных последовательностей (опция).
(Завершение этапа 3 протокола требуется для выполнения этой задачи).
5. Анализ уровня Средний уровень неоднородности (МРТ) Входные и случайных последовательностей.
6. Дополнительные программы в рамках Геномная МРТ пакет (по желанию).
Геномная МРТ ресурса также имеет две дополнительные опции для генерации очень специфических случайных последовательностей. Они доступны через "МРТ Генератор" и "CDS Генератор" вкладки в верхней строке.
7. Представитель Результаты
Этот протокол позволяет пользователю исследования композиционной неоднородности нуклеотидных последовательностей. Важно, что она также поддерживает генерацию различных рандомизированных последовательностей с олигонуклеотидного состава, близкой к входных последовательностей. Как правило, геномные последовательности комплексных эукариот не однородны по составу, а, скорее, представляют собой сложную мозаику последовательности сегментов обогащенный частности нуклеотиды (например, богатые пуринами (G + T)-богатые, (А + Т)-богатые, и т.д.). Эти модели в середине диапазона шкалы (30-1000 б.п.) визуализируются на графический вывод МРТ анализатор, который показывает, выбранных содержательных сегментов, как верхняя синяя шипы и содержание бедных сегментов нижней красной шипами (рис. 1 и 2). Как правило, номер любой содержательный и контент-бедные регионы в натуральном (рис. 1) на порядок раз выше, чем число того же типа регионов в соответствующих рандомизированных последовательностей (рис. 2) с той же олигонуклеотида композиции. Эти последовательности сегментов среднего уровня неоднородности нуклеотидного состава могут представлять интерес для пользователя. Они доступны из геномной МРТ выходных файлов для дальнейшего расследования.
Рисунок 1. Пример МРТ анализатор графического вывода из шага 5.7. Результаты были получены на выборке из 44 человек интронов. Синие столбики представляют собой позиции GC-богатых регионах, расположенных вдоль этих интронов. Красные полоски представляют GC-бедных (или AT-богатые) МРТ регионах. У-ось включает верхний и нижний пороги для данного типа контента.
Рисунок 2. МРТ анализатор выход для случайной последовательности "userfile.rand1_4".
Графическикал представление МРТ в случайно сгенерированных последовательностей с помощью программы НИИ генератора.
Рисунок 3. Пример начале текстового файла, выход из МРТ анализатора.
Все содержательные и содержание бедных последовательности обнаружены программы представлены в последнем (четвертом) колонке. Их взаимное расположение, измеряется в количестве окон, приведены в первой колонке. Второй и третий столбцы индикаторов для содержательной и контент-бедные регионы, соответственно.
Регионы с неоднородным нуклеотидного состава на средних масштабах (30-1000 нуклеотидов) являются избыточной в геномах эукариот комплекса и может быть найден в любом месте (межгенных регионов, интроны, непереведенные регионов экзонов, повторяющихся элементов). Эти регионы часто связаны с необычными конформации ДНК. Например, purine-/pyrimidine-rich последовательности, как правило, форму ДНК триплексы (Н-ДНК); последовательностей с переменным пуриновых / пиримидиновых оснований, связанных с Z-ДНК конформации; (G + C)-богатые регионы выставку структурные отклонения в B- ДНК и могут быть склонны к магистральным расщепления; (+ Т)-богатые регионы могут лечь необычную структуру - ДНК раскручивание элемента и т. д. (см. обзор Федоров и Федорова 2010). Некоторые из этих средних моделей (например, (G + T) богатых регионов) едва ли расследованы и все еще ждут тщательного исследования и признания. Основная цель нашей Геномная МРТ веб-ресурс, чтобы помочь пользователям в идентификации этих регионах МРТ для их дальнейшего экспериментального анализа и изучения их возможных функций. Знание МРТ регионов могут быть включены в и улучшить новое поколение программ гена предиктором (Shepard 2010) и продвинуть наше понимание генома функций и свойств.
Мы благодарны Сэмюэль Шепард, Питер Bazeley, и Джон Дэвид Белл за управление Геномная МРТ веб-страниц. Работа выполнена при поддержке Национального научного фонда Карьера премии "Исследование роли интрон сотовой" [номер гранта MCB-0643542].
Запросить разрешение на использование текста или рисунков этого JoVE статьи
Запросить разрешениеThis article has been published
Video Coming Soon
Авторские права © 2025 MyJoVE Corporation. Все права защищены