Протокол, описанный здесь, предоставляет подробные инструкции по анализу геномных областей, представляющих интерес для потенциала кодирования белка, с использованием phyloCSF в удобном для пользователя браузере генома UCSC. PhloCSF может эффективно идентифицировать сохраненные короткие открытые кадры чтения с микробелковым кодирующим потенциалом в геномных областях, которые в настоящее время аннотированы как некодирующие. Методы, описанные здесь, легко используются и могут быть реализованы исследователями любого происхождения без предварительной подготовки или опыта в биоиформатике или сравнительной геномике.
Для начала откройте окно интернет-браузера и перейдите к браузеру генома Калифорнийского университета в Санта-Крус или UCSC. Под заголовком наши инструменты выберите опцию Концентраторы треков. На вкладке Общедоступные концентраторы введите phyloCSF в поле условия поиска.
Затем нажмите кнопку поиска в общедоступных концентраторах. Подключитесь к phyloCSF, нажав на кнопку подключения для имени концентратора phyloCSF. После нажатия кнопки «Подключиться» подождите, чтобы перенаправить на страницу шлюза браузера генома UCSC.
Чтобы запросить другой вид, выберите интересующий вид под заголовком обзора или выберите вид, щелкнув соответствующий значок, или введите вид в текстовое поле, в котором говорится, что введите общее название вида или идентификатор сборки.С помощью раскрывающегося меню выберите сборку для поиска под определенным заголовком позиции, затем введите символ гена позиции или условия поиска в поле позиции или поискового запроса и нажмите «Перейти», чтобы перейти к навигации к гену, представляющему интерес в геноме браузера. Если поиск привел к нескольким совпадениям, ожидайте перенаправления на страницу, которая требует выбора интересующей позиции, то нажмите на соответствующий ген интереса. После перехода к браузеру генома UCSC выберите бластоподобный инструмент выравнивания или блат под заголовком наших инструментов для запроса определенной последовательности ДНК или белка.
Кроме того, наведите курсор на вкладку инструментов и выберите опцию blat или перейдите по указанной ссылке. С помощью раскрывающегося меню выберите интересующий вид, геном и сборку. Затем определите тип запроса, вставьте интересующую последовательность в текстовое поле blat search genome и нажмите кнопку Submit.
Затем нажмите на ссылку браузера под заголовком действий, чтобы перейти к интересующей геномной области. Визуально сканируйте геномную область, представляющую интерес, на предмет положительной оценки областей phyloCSF. Используйте функцию масштабирования для увеличения областей, представляющих интерес, для изучения характеристик последовательности и поиска кодонов запуска и остановки.
Чтобы увеличить масштаб вручную, удерживайте клавишу shift, а затем нажмите и удерживайте кнопку мыши, перетаскивая вдоль интересующей области. Кроме того, для навигации можно использовать кнопки увеличения и уменьшения масштаба в верхней части страницы. Увеличивайте масштаб до тех пор, пока не станет видна нуклеотидная или базовая последовательность.
Визуально сканируйте последовательность ядерных приливов вблизи начала и конца положительно оцениваемых областей phyloCSF, чтобы определить карательные кодоны начала и остановки. Наведите курсор мыши на заголовок представления в верхней части страницы и нажмите на опцию преобразования в другие геномы, затем определите интересующий геном с помощью раскрывающегося меню под новым заголовком генома. Выберите интересующую геномную сборку под новым заголовком сборки и нажмите кнопку отправки.
После того, как браузер возвращает список регионов в новой сборке со сходством. Нажмите на ссылку положения хромосомы, чтобы перейти к гомологичной области, представляющей интерес. Следуйте навигационным стратегиям, описанным ранее, чтобы проанализировать последовательность.
Чтобы перейти на страницу описания гена, нажмите на интересующий ген в треке кода гена в браузере генома UCSC. Под заголовком последовательность и ссылки на инструменты и базы данных нажмите на ссылку в таблице, которая быстрее считывает другие виды. Нажмите на поля, связанные с интересующими видами, чтобы выбрать их.
Затем нажмите «Отправить». Скопируйте и вставьте последовательности, отображаемые в нижней части страницы в более быстром формате, в текстовый документ. Затем откройте второе окно браузера и перейдите к инструменту выравнивания множественных последовательностей clustal omega на веб-сайте Европейского института биоинформатики.
Вставьте файлы последовательностей в буфер обмена в поле на первом шаге, которое считывает последовательности в любом поддерживаемом формате. Прокрутите страницу вниз и нажмите «Отправить». Наблюдайте ниже выровненные результаты для символов, которые указывают на степень сохранения каждой аминокислоты.
Чтобы просмотреть свойства аминокислот и цвет, нажмите на ссылку показать цвета непосредственно над последовательностями, чтобы окрасить аминокислоты в соответствии с их свойствами. Затем скопируйте и вставьте выравнивание последовательности в программу обработки текста или слайд-шоу, чтобы создать файл рисунка или иллюстрации. Чтобы просмотреть другие результаты со страницы результатов clustal omega, нажмите на дерево руководства вкладок или генетическое дерево фило.
Наконец, нажмите на вкладку средства просмотра результатов для просмотра информации о последовательности с помощью jalview или для доступа к прямым ссылкам на mview и простую филогению. Репрезентативный анализ phyloCSF гена миторегулина указывает на область сохранения высокой последовательности, соответствующую валидированному микробелку. Полная кодирующая последовательность миторегулина содержится в экзоне один и очень высоко оценивается на phyloCSF минус один трек.
Законсервированный стартовый кодон можно наблюдать в начале положительно оценивающей области в филоКСФ минус одна дорожка. Положительно оценивающая область в первом экзоне миторегулина начинается непосредственно над стартовым кодоном и заканчивается на стоп-кодоне. Здесь показано многократное выравнивание последовательности микробелка миторегулина для восьми различных видов.
Анализ длинного некодирующего горячего воздуха РНК показал отрицательный балл по всему гену во всех шести треках, что указывает на отсутствие сохранения последовательности и подтверждает, что горячий воздух правильно аннотирован как некодирующая РНК. Анализ PhyloCSF мыши один, восемь, один, ноль, ноль, пять, восемь, I 24 rike ген показал, что законсервированный открытый кадр чтения охватывает три экзона, а положительная оценка phyloCSF скачет от плюс двух треков в экзоне один к плюс три трека в экзоне два, а затем обратно к плюс двум дорожкам в экзоне три. Анализ PhyloCSF локуса одного гена также эффективно использовался для идентификации нескольких различных кодирующих открытых кадров считывания в пределах одной молекулы РНК.
Важно отметить, что, хотя положительный показатель phyloCSF в значительной степени наводит на мысль о способности микро-белка кодировать, эта линия доказательств не может стоять отдельно и должна быть экспериментально подтверждена. После того, как период микробелка был идентифицирован, аминокислотная последовательность может быть проанализирована на предмет сохраненных доменов или характеристик последовательности, чтобы дать представление о ее функции. PhyloCSF эффективно используется для идентификации новых микробелков в геномных областях, которые ранее считались некодирующими, и будет продолжать оставаться полезным инструментом в будущих исследованиях идентификации микробелков.