JoVE Logo

Войдите в систему

Для просмотра этого контента требуется подписка на Jove Войдите в систему или начните бесплатную пробную версию.

В этой статье

  • Резюме
  • Аннотация
  • Введение
  • протокол
  • Результаты
  • Обсуждение
  • Раскрытие информации
  • Благодарности
  • Материалы
  • Ссылки
  • Перепечатки и разрешения

Резюме

Эта статья описывает процедуру идентификации и характеристика гена семьи в виноградной лозы, применяется к семье ligases убиквитин E3 Arabidopsis Tóxicos в Levadura (библиотека ATL).

Аннотация

Классификация и номенклатура генов в семье может значительно способствовать к описанию разнообразия закодированные белков и предсказание семейных функций на основе нескольких функций, таких как присутствие последовательности мотивы или особое сайты для столб-поступательные изменения и выражение профиль членов семьи в различных условиях. Эта работа описывает подробный протокол для семьи характеристика генов. Здесь эта процедура применяется к характеристике Arabidopsis Tóxicos в Levadura (ATL) E3 убиквитин лигаза семьи в виноградной лозы. Методы включают генома идентификации членов семьи, характеристика гена локализации, структуры и дублирования, анализа сохраненных белков мотивы, предсказание сайтов локализации и фосфорилирование белков, а также ген выражение профилирование по всей семьи в разных наборов данных. Такая процедура, которая может быть расширен для дальнейшего анализа в зависимости от экспериментальных целей, могут применяться к любой семье гена в любых видов растений, для которого имеются геномных данных, и предоставляет ценную информацию для выявления интересных кандидатов для функциональных исследований давая понимание молекулярных механизмов адаптации растений к их окружающей среде.

Введение

В течение последнего десятилетия много исследований было проведено в Грейпвайн геномики. Грейпвайн – является признанным экономически значимых культур, который стал моделью для исследований на развитие плода и на реакции древесных растений к биотическим и абиотическим стрессовым. В этом контексте освобождение геном Vitis vinifera cv. PN40024 в 2007 году1 и его обновленную версию в 20112 привели к быстрому накоплению «омику»-масштаба данных и всплеск высок объём исследований. На основе опубликованных последовательности данных, всесторонний анализ данного гена семьи (обычно состоит из белков, обмена сохраняется мотивы, структурные или функциональные сходства и эволюционных отношений), теперь могут быть выполнены раскрыть его молекулярные функции, эволюция и профили выражения гена. Эти анализы могут способствовать пониманию как ген семей контролировать физиологические процессы в масштабах всего генома.

Многие аспекты жизненного цикла растений регулируются убиквитин опосредованного деградации ключевых белков, которые требуют оборачиваемостью доработаны для обеспечения регулярного клеточных процессов. Важные компоненты процесса деградации убиквитин опосредованного ligases убиквитин E3, которые отвечают за гибкость системы, благодаря набору конкретные цели3. Соответственно эти ферменты представляют собой семейство огромный гена, с около 1400 E3 лигаза кодирование генов предсказал в проростках Arabidopsis thaliana генома4, каждая E3 убиквитин лигаза, действуя для ubiquitination конкретных целевых белков. Несмотря на важность конкретного субстрата ubiquitination в клеточной регуляции в растениях мало что известно о как регулируется ubiquitination путь и белков-мишеней были выявлены только в нескольких случаях. Расшифровка такой специфики и регулирование механизмов зависит сначала идентификации и характеризации различных компонентов системы, в частности E3 ligases. Среди ligases убиквитин ATL подсемейство характеризуется 91 членов, определенных в A. thaliana показано кольцо-H2 палец домена5,6, некоторые из них играет свою роль в обороне и гормон ответы7.

Первым важным шагом для определения членов нового гена семьи является точное определение семейных функций, таких как консенсус мотивы, ключевые домены и характеристики последовательности белка. Действительно надежный поиск всех членов семьи гена, на основе анализа взрыва требует некоторые обязательные последовательности характеристики, в частности белка доменах ответственным за белка функция/деятельность, выступающей в качестве подписи белка. Это может быть облегчено предыдущих характеристика той же семьи гена в других видов растений или достигнуто путем анализа различных генов, предположительно принадлежащих к той же семье в различных видов растений, чтобы изолировать общих последовательностей. Члены семьи могут затем быть индивидуально названы следующие общие правила, заселен международных консорциумов для данного растения. В виноградной лозе к примеру, такая процедура подвергается рекомендации Комитета супер-номенклатура для винограда гена аннотации (sNCGGa), создание строительство филогенетическое дерево, включая V. vinifera и A. thaliana членов семьи гена разрешить гена аннотации на основе нуклеотидной последовательности8.

Хромосома локализация генов дублирования обследования и членов семьи позволяют, подчеркнув наличие всего генома или тандем дублируется генов. Такая информация представляется полезным разгадать предполагаемого гена функции, поскольку он может показать функциональные избыточности или выявить различные ситуации, то есть, не функционализации, нео функционализации или суб функционализации9. Обе нео - и суб - functionalization являются важными событиями, которые создают генетические новизны, предоставления новых клеточных компонентов для адаптации растений к меняющимся среды10. В частности дублирования предков генов и производство новых генов были очень часто в ходе эволюции генома виноградной лозы и недавно сформированной генов, возникая от проксимальных и тандем дублирования в grapevine чаще производить новые 11функции.

Еще одним ключевым фактором в расшифровке семьи функции гена-транскриптомики профиль. Наличие общедоступных баз данных, предоставляя доступ к огромное количество транскриптомики данных могут быть использованы таким образом назначить предполагаемые функции гена членов семьи с использованием крупномасштабных в silico анализа выражения. Действительно своеобразное выражение некоторых генов в органов конкретных растений или в ответ на определенные подчеркивает может дать некоторые подсказки относительно предполагаемых ролей соответствующих белков в определенных условиях и оказывать поддержку гипотезы о возможных суб функционализация дублируется генов реагировать на различные вызовы. Для этой цели, важно рассмотреть несколько наборов данных: они могут быть уже имеющихся ген выражение матриц, таких как Атлас генома всей транскриптомики органов виноградной лозы и этапы развития12, или может быть построен ad hoc по получение транскриптомики наборов данных для конкретных растений, подвергается определенным напряжений. Кроме того простой подход с использованием двух матриц, один с попарных сходство данных и один с коэффициентами попарных Сопредседатель выражение может применяться для оценки взаимосвязи между последовательности подобия и выражения шаблоны в семейство генов.

Цель этой работы-обеспечить глобальный подход, определяя структуру гена, сохраненных белков мотивы, хромосомных местоположение, Джин дублирования и шаблоны выражений, как также предсказание белка локализации и фосфорилирование сайтов, для достижения исчерпывающую характеристику семейство генов растений. Такой комплексный подход применяется здесь к характеристике ATL E3 убиквитин лигаза семьи в виноградной лозы. Согласно новой роли членов подсемейство ATL в регулировании основных клеточных процессов7, эта работа может также содействовать выявлению сильных кандидатов для функциональных исследований и в конечном итоге разгадать молекулярные механизмы, регулирующие адаптация этой важной культурой для своей окружающей среды.

протокол

1. Определение предполагаемого ATL семейство генов участника(ов)

  1. PSI-ДОМЕННАЯ веб-версия
    1. Откройте веб-страницу взрыва13 и нажмите на раздел белка взрыва.
    2. В поле «Ввод запроса последовательности» введите последовательность аминокислот белка (здесь VIT_05s0077g01970), который будет использоваться в качестве зонда для определения других членов семьи.
      Примечание: Хороший представитель белков должны быть использованы (белок, отображение всех важных особенностей, которые характеризуют семьи).
    3. В поле «Выбрать Поиск набора» выберите базу данных «Ссылка белка» (refseq_protein) и организм интерес (V. vinifera - taxid:29760).
    4. В поле «Выбор программы» выберите алгоритм PSI-взрыв и нажмите кнопку «взрыв» для запуска анализа.
      Примечание: Нажав на «параметры алгоритма» можно настроить некоторые дополнительные параметры (Макс последовательности, матрица скоринга, PSI-ДОМЕННАЯ порог и т.д.).
    5. Первый раунд взрыв извлекает все последовательности, отображение соответствующих матчи с запросом (e значение выше выбранного порога - по умолчанию 0,005; 0,001 в этом эксперименте). Отменить выбор всех записей, которые явно не принадлежат к семейству рассмотрении нажатием на галочку в столбце «выберите для PSI-BLAST» и запустить второй итерации PSI-взрыв, нажав кнопку взрыва как шаг 1.1.4.
    6. Недавно выявленные последовательности будут выделены желтым цветом. Отменить выбор явно неправильно проверено хитов и раскрыть дополнительные итерации, как описано в шаге 1.1.5.
    7. Продолжите итераций, пока алгоритм не найти каких-либо соответствующих запись или достигнет конвергенции (найдено никаких новых записей). Скачайте список предполагаемых генов членов семьи для дальнейшего анализа. Осмотрите проверено хитов в каждой итерации, чтобы избежать наличия ложных срабатываний.
  2. PSI-ДОМЕННАЯ автономная версия
    1. Скачайте отдельную версию взрыва, нажав кнопку «Загрузить взрыв» на домашней странице взрыва13.
      Примечание: Взрыв автономное программное обеспечение является командной строки версии Web-интерфейса, описано ранее. Он позволяет выполнение поиска PSI-взрыва против пользовательской локальной или удаленной базе данных. Кроме того она позволяет осуществлять поиск с предварительно определенные положения конкретных Оценка матрица (запасами).

2. ручной проверки PSI-взрыв определенных членов семьи

  1. Несколько выравнивания
    1. Собирать амино кислой последовательностей, ранее определенных в файле FASTA-формате и загрузить его в программного обеспечения мега14 приступить несколько выравнивания.
    2. Откройте программное обеспечение MEGA, нажмите кнопку «Выровнять», нажмите «Edit/построить выравнивание», нажмите кнопку «Создать новый выравнивание», нажмите «Белка».
    3. Нажмите кнопку «Редактировать» от меню выравнивание и «Вставка последовательности из файла». Перейдите к файлу FASTA, созданные до и подтвердите загрузку всех исследуемых последовательностей.
    4. Нажмите кнопку «Выравнивание» от меню выравнивание и «Выровнять по мышц». Использовать параметры по умолчанию, нажмите кнопку «Вычислить» и дождитесь завершения несколько выравнивания.
    5. Осмотрите несколько выравнивания исключить неверно предсказал членов семьи. Канонический CxxC (13 x) PxCxHxxHxxCxxxW (7 x) CxxCW мотив, (в частности присутствие остатков пролина перед третьим цистеин), является ключевой особенностью, необходимые для определения членов семьи ATL.
  2. Анализ конкретных логотип
    1. Представить окончательный список членов семьи (96 Грейпвайн последовательности выполнения требований будет считаться ATL) несколько Em мотив заключения (мем)15 для определения сохраняемой мотивы по всей семьи.
    2. На домашней странице MEME нажмите на кнопку «Мем» и завершить «Данных представления формы» с конкретной информацией относительно семьи интерес.
    3. Использование анализа MEME подтвердить наличие двух ожидаемых мотивов внутри членов семьи ATL виноградной лозы, т.е., кольцо-H2 и мотивы ООВ.
  3. Кроме того, выполните шаги 2.1 и 2.2, одновременно используя набор программного обеспечения биоинформатики (см. Таблицу материалы).
    1. Загрузить файл FASTA (см. шаг 2.1.1) в suite. Выберите «Файл» из меню, а затем «Импорт» и нажмите «из файла». FASTA файл и нажмите «Открыть».
    2. Выберите все импортированные последовательностей в списке и нажмите на кнопку «Выровнять/сборка» в панели инструментов, а затем нажмите кнопку «Pairwise несколько выравнивание». Выберите «Мышцы выравнивание» и нажмите кнопку «ОК», чтобы запустить выравнивание с помощью параметров по умолчанию.
    3. Чтобы визуализировать логотип выравнивание, нажмите на «Графики» → «параметры» и выберите «Последовательность логотип».

3. Анализ белков физических параметров и домены

  1. Как определение различных физических параметров опрошенных членов семьи важно иметь всеобъемлющее описание семьи, представить список членов семьи к конкретным веб-инструменты.
    1. Для Изоэлектрическая точка (pI) и молекулярного веса (кДа) используйте инструмент ProtParam16 на веб-сайте Expasy с параметрами по умолчанию.
    2. Для локализации внутриклеточных белков используйте различные инструменты для получения более надежных предсказание например ngLOC v1.017 с параметрами по умолчанию, targetP v1.118 с параметрами по умолчанию и белка Мародер субцеллюлярные локализации v1.219 с сокращения вероятности 0.5. Фосфорилирование сайтов используйте MUsite v1.0 веб инструмент20 с параметрами по умолчанию.
  2. Исследуйте дополнительные белка доменов в членов семьи.
    1. Откройте веб-страницу базы данных Pfam21, выберите инструмент «Поиск последовательности», представить белковых последовательностей в поле запроса и нажмите кнопку «Go», чтобы запустить анализ.
      Примечание: Каждая последовательность белка анализируется отдельно. E значение 1.0 в параметр по умолчанию позволяет проводить дискриминацию между значительным и незначительных хиты.
    2. Открывайте TMHMM сервера22 из центра для анализа биологических последовательностей для расследования присутствия предполагаемого трансмембранного регионов.
Вставить все последовательности белка одновременно в поле запроса (или же загрузить текстовый файл, включая все последовательности белка в формате FASTA) и нажмите кнопку «Отправить», чтобы запустить анализ.
  • Анализ белков, не хватает предсказал трансмембранных доменов, согласно TMHMM (шаг 3.2.2), с ProtScale инструмент для выявления предполагаемых гидрофобные регионов. Откройте веб-страницу ProtScale23. Вставить каждой последовательности белка в поле запроса и выберите пункт «Hphob. / Kyte & Дулитл» как аминокислоты масштаба. Нажмите кнопку «Отправить», чтобы запустить анализ.
  • 4. хромосомных распределение, дублирования и Организация ЭКЗОН Интрон

    1. Карта ATL членов семьи на хромосомы, основанные на данных, полученных из виноградной лозы генома CRIBI Biotech центр веб-сайт24.
      1. Просмотр главной страницы сайта PhenoGram25. Запись «входной файл» как табуляцией текстовый файл с особенностями генов для сопоставления на хромосомы, согласно исчерпывающие рекомендации и примеры относительно компиляции файл после путь «Phenogram» →» Документация» → «Опции» → «входной файл».
      2. Запись «Титул» работы. Выберите геном быть выписанным. Для геномов, не реализованы в программном обеспечении, например геноме виноградной лозы выберите «другое» в раскрывающемся меню. Запись файла генома согласно рекомендации и примеры, следуя по пути «Phenogram» → «Документация» → «Опции» → «Геном» и загрузить его.
      3. Использовать параметры по умолчанию «Фенотип интервалы», «Фенотипом цвета», «Формат изображения» или выберите альтернатив в соответствующих меню и нажмите кнопку «Печать» для получения визуализации генов в хромосомах за гены.
    2. Определите состояние дублирования с использованием программного обеспечения MCScanX26членов семьи.
      1. Скачайте и распакуйте копию MCscanX на локальном компьютере запуск командной строки 1 (дополнительный файл 1). Введите папку MCscanX и создать необходимые исполняемые файлы запуска командной строки 2 (дополнительный файл 1).
        Примечание: Установка MCscanX известно неудачу на некоторых машинах Linux 64 bit вследствие относительно функция chdir. Если относящиеся к этой функции после make возвращается сообщение об ошибке выполнения команды, следует запускать в командной строки 3 (дополнительный файл 1) и команду «make», должно выполняться после этого.
      2. Скачайте V. vinifera белков и аннотации файл запуска командной строки 4 (дополнительный файл 1).
        Примечание: Файл аннотации Грейпвайн нужно быть unzipped и одной хромосомы информации Кот в уникальный файл, запустив командные строки 5 (дополнительный файл 1).
      3. Запуск «все против всех» blastp Поиск с использованием файла V. vinifera белка как запрос, так и предметом.
      4. Создайте базу данных для поиска взрыв с использованием V. vinifera белка файл запуска командной строки 6 (дополнительный файл 1). Выполните поиск blastp с помощью файла белки V. vinifera как запрос к базе данных, созданный ранее, запустив командные строки 7 (дополнительный файл 1).
      5. Преобразуйте файл аннотации в подходящий формат для MCScanX. Запуск командной строки 8 (дополнительный файл 1) для загрузки пользовательских perl скрипт parseMSCanXgff.pl. Выполните анализ выполнения командной строки 9 (дополнительный файл 1).
        Примечание: Файл vitis.gff создается содержащий координаты гена в следующем формате:
        SP # гена, начальная позиция ending положение
        где «СП» — двухбуквенный код для видов (Vv для виноградной лозы), тогда как «#» — это имя леса. Обратите внимание, что предоставленный пользовательский perl-скрипт подходит для большинства преобразования, хотя в некоторых конкретных случаях вследствие многообразия информации, представленной в файле доступны аннотации могут потребоваться некоторые изменения кода.
      6. Запуск MCScanX запуск командной строки 10 (дополнительный файл 1).
        Примечание: «Витис» является префиксом аннотацию и взрыва выходного файла. Это является обязательным требованием для программного обеспечения для запуска.
      7. Анализ результатов MCScanX. MCScanX производит один текстовый файл «vitis.collinearity», который содержит коллинеарных блоков. Такой файл может быть проверен любым текстовым редактором (см. Пример вывода 1 дополнительный файл 1).
        Примечание: В «mcscaxOutput.html» каталог создается, содержащий html-файлы, показывая несколько рядов блоков коллинеарных против каждой эталонной хромосомы. Эти файлы могут быть проверены через веб-браузер.
      8. Классифицируйте paralogous генов, основанный на их относительные позиции в хромосомах запуск командной строки 11 (дополнительный файл 1).
        Примечание: Paralogous гена классификации описан в Дополнительной таблице II. Сгенерированный выходной файл «vitis.gene_type» содержит все сведения происхождения с форматом простой с разделителями табуляции.
      9. Выполните анализ обогащения для оценки ли семейство генов бытовой возникла на конкретный механизм запуска командной строки 12 (дополнительный файл 1).
        Примечание: Файл «vitis.gene_type» создается на этапе 4.2.8, тогда как файл «gene_family_file» представляет собой одну строку текстового файла, в котором имя семейства (например, ATL_genes) следуют Локус имена для всех генов, принадлежащих к семейству разделенные вкладки. Прикладной статистический тест для обогащения является точный тест Фишера и p-значения различного происхождения, хранятся в файле «outputFile.txt».
    3. Визуализируйте Экзон Интрон организации генов с помощью интерактивных Древо жизни (iTOL)27, он-лайн инструмент для отображения, аннотации и управления филогенетических деревьев.
      1. Загрузите филогенетическое дерево в разделе «Загрузки» на сайте iTOL. Дерево строится согласно статье 5 ниже. Для каждого члена семьи гена получить Предсказание структуры генов из V1 аннотации генома виноградной лозы (сайт CRIBI цитируется выше). Рассчитайте длину (в bp) предполагаемого экзонов, интронов и непереведенные регионов (необычных).
      2. Используйте набор данных, «Доменов протеина» для графической визуализации Экзон Интрон шаблона.
    Напишите в обычный текстовый файл, включая рассчитанные длины согласно спецификаций, предоставленных после путь «Справка» → «страниц справки» → «Типы данных» → «Домены белка» в веб-сайт iTOL27. С помощью набора «Домены белка», «прямоугольник (RE)» и «разрыв (GP) прямоугольник» фигуры представляют экзона и необычных, соответственно.

    5. филогенетический анализ и номенклатура

    1. Проанализируйте отношения между членами семьи ATL путем строительства филогенетическое дерево высокого качества и определение семьи номенклатуры.
      1. Для семьи гена виноградной лозы следуйте правилам, установленным в Grapevine Super номенклатура Комитета8.
      2. Извлечение последовательности A. thaliana ATL, как ссылку для виноградной лозы гена номенклатуры8, от базы данных UniProt28 .
      3. Напишите файл FASTA, включая все нуклеотидные последовательности виноградной лозы и A. thaliana гена членов семьи должны быть включены в филогенетический анализ. Нуклеотидные последовательности позволяют максимум изменчивости среди членов семьи (по сравнению с белковых последовательностей).
    2. Филогенетическое дерево
      Примечание: Использование конвейера 29 Phylogeny.fr рекомендуется получить филогенетическое дерево высокого качества, но не является обязательным.
      1. Просмотр главной страницы Phylogeny.fr29и выберите трубопровода «Филогения анализ».
        Примечание: «Один клик» подходит в большинстве случаев, но при необходимости его можно выбрать конкретные дополнительные параметры («дополнительно») или даже полностью настроить анализ («а La Carte»; см. шаг 5.2.5).
      2. Записи «Имя анализа», загрузить файл FASTA, созданный ранее (шаг 5.2.1 и нажмите кнопку «Отправить», чтобы запустить анализ.
      3. Кроме того если процедура описана выше (шаги 5.2.1, 5.2.2) результаты в сообщение об ошибке, завершайте каждый шаг трубопровода филогении люкс индивидуально, следующим образом.
        1. МЫШЦЫ программного обеспечения домашней странице30загрузить файл FASTA в «Шаг 1», выберите «Пирсон/FASTA» как «Формат вывода» в «Шаг 2» и нажмите кнопку «Отправить» в «Шаг 3» для выравнивания последовательности запроса.
        2. Нажмите кнопку «Загрузить файл выравнивание» и сохраните как файл FASTA для дальнейших шагов.
        3. Процесс выравнивания FASTA файл, чтобы устранить плохо согласованы позиции, с помощью сервера Gblocks инструмент31. Загрузить файл FASTA выравнивание, выберите «ДНК» как «Тип последовательности» и выбрал вариант(ы) жесткости, который лучше всего подходит с анализа (например, для виноградной лозы ATL гена семьи выберите все три варианта предложил «менее строгого отбора», потому что высокая последовательность расхождения). Нажмите «Получить блоки» чтобы запустить анализ.
        4. Нажмите кнопку «Результирующая выравнивание» в нижней части страницы выходных данных и сохранить результаты в новом файле FASTA.
        5. Главная Phylogeny.fr29выберите «A la Carte» как «Филогения анализ» трубопровода. Затем, снимите флажок «Несколько выравнивание» и «Выравнивание курирование». Нажмите кнопку «Создать рабочий процесс», загрузите файл Gblocks куратор FASTA (шаг 5.2.5.4), выберите «Bootstrapping процедура» с параметрами по умолчанию в «Настройки» и нажмите «Отправить», чтобы запустить анализ.
      4. Крах плохо поддерживает ветви (например, загрузчик значения < 70%), нажав кнопку «Сворачивать ветви» в разделе «Выбор и действия» и скачать окончательные результаты в формате Невик для дальнейшего анализа.
    3. Назначьте имя гена, основанный на филогении.
      1. Обзор филогенетическое дерево, чтобы оценить надежность структуры дерева, загрузив его в iTOL люкс, упомянутых выше (раздел 4.3).
      2. Назначьте вручную ген имя каждого члена семьи. В случае индивидуальных orthologues, назначить Arabidopsis-как имя (например, AtATL3 → VviATL3). Дифференцировать Грейпвайн генов (два или более) вытекающие из одного Arabidopsis гомолога с же филогенетических расстояние, используя цифры или буквы если геном арабидопсиса заканчивается с числом (например, AtATL23 → VviATL23a, VviATL23b).
      3. В случае orthologues один ко многим или многие ко многим, назначить новое имя ген состоит из Arabidopsis-как имя (здесь, «Атл») в паре с номером выше, чем наибольшее число уже используется для V. vinifera и арабидопсиса (например., VviATL83).
      4. Полное номенклатуру недавно определенные семьи, спуская от верхней к нижней части филогенетическое дерево.

    6. Грейпвайн органа и стадии выражение профилирования

    1. Создание рабочих данных матрицы содержащие выражения данных для членов семьи.
      1. Скачайте по ссылке, распределенных на платформе ResearchGate32 V. vinifera cv. Корвина ген выражение Атлас datamatrix. Этот файл содержит значения выражения RMA нормированный использоваться в следующие шаги.
      2. Извлечь значения выражения для каждой семьи генов из атлас datamatrix и написать «Рабочая datamatrix», содержащий же строка заголовка как datamatrix Атлас. Сохраните «Рабочая datamatrix» как табуляцией текстового файла.
    2. Выполните иерархических Би кластерный анализ, используя Multi эксперимент Viewer (МэВ) программного обеспечения.
      1. Скачать и установить программное обеспечение МЭВ33.
      2. Загрузить «Рабочая datamatrix» (шаг 6.1.2) по пути «Файл» → «Загрузка данных» → «Обзор» и выберите текстовый файл. Выберите «Single цвет массив» и снять галочку «Load аннотации» когда автоматической аннотации не предоставляется. Выберите значение верхнего левого выражения предварительного просмотра таблицы выражение и нажмите кнопку «Загрузить».
      3. Корректировка данных, применения преобразований Log2 («Корректировать данные» → «Журнала преобразований» → «Log2 преобразования») и гена/строки нормализации («Корректировать данные» → «Джин/ряд корректировок» → «медиана центр гена/строки»). Установите предел надлежащего масштаба («Отобразить» → «задать цвет границы шкалы»).
      4. Вычислить иерархическая кластеризация по пути «Анализ» → «Группирование» → «HCL».
    Выберите «Оптимизировать порядок гена лист» и «Оптимизировать образец листьев порядок» в «Заказе оптимизации поле», «Корреляции Пирсона» в поле «Расстояние матрица выбора», «средняя связь кластеризации» и в поле «Выбор метода связь». Затем нажмите кнопку «ОК», чтобы запустить анализ.
  • Просмотрите результаты в меню «HCL» → «Результаты анализа» на левой панели окна. Экспортируйте тепловой карте, нажав кнопку «Сохранить изображение» в меню «Файл».
  • 7. выражение профилирование в ответ к биотическим и абиотическим стрессовым

    1. Повторите шаг 6.1 с идентификатором присоединения GSE получены из соответствующих публикаций и исследований, исследование биотического и абиотического стресса на виноградной лозы. Например эксперименты, обеспечивая транскриптом профиль виноградной ягоды инфицированных грибкового патогена Botrytis cinerea с помощью microarray винограда NimbleGen целом генома могут просматриваться с ГСИ ID GSE52586. Повторите шаги 6.1.1 и 6.1.2.
    2. Поиск Архив считывает последовательность NCBI34 с SRA/BioProject ID (например, SRP055458 или PRJNA275778 для «виноградной лозы цветка затенение» экспериментов) и скачать все связанные считывает необработанные последовательности. РНК seq наборов данных из многих различных исследований, обрабатываются с помощью единого конвейера для обеспечения согласованности.
      1. Вкратце обрезать сырой последовательности FASTQ чтений (одно - и пара конец) и фильтр качества с Trimmomatic35. Использование AVGQUAL и MINLEN фильтр 20 и 40, соответственно и все параметры по умолчанию.
      2. Индекс 12 X Грейпвайн ссылка генома1 с помощью Bowtie236. Скачайте 12 X Грейпвайн ссылка генома (например, bowtie2-строить) перед запуском команды bowtie2 .
      3. Получите количество матрица таблиц с htseq граф37 с помощью файла аннотации (GFF/GTF) модель гена V1 виноградной лозы.
    3. Выполните анализ дифференциального ген выражение (ре-) в R38 с40 Лимма39 библиотеки для RMA-нормированный матрицы и DESeq2 для игр матрица таблиц, полученных из шагов 7.1.1 и 7.2.1, соответственно.
      1. Выполнить стандартное сравнение «два групп» (то есть, «лечение» / «контроль»). Убедитесь, что дизайн матрица/группировки «управляет» и «лечение» условий указаны правильно.
        Примечание: Типичный дизайн для microarray анализ дифференциального выражения (GSE52586) для сравнения Эль-33 ягоды, инфицированных с Botrytis cinerea против управления (здоровых) ягоды на той же стадии развития Лимма запуск командной строки 13 показано в дополнительных файлов 1. Типичный дизайн для анализа дифференциальной выражение РНК seq (SRP055458 или PRJNA275778), для сравнения цветов (на 7 дней после Кап осень) под тени лечения против управления с DESeq2 запуск командной строки 14 показан на дополнительных файлов 1 .
      2. Получение списков дифференциально выраженной генов (град) в каждом контраст, для Лимма, использовать функции lmFit(), а затем eBayes()и затем topTable() функции, в то время как для DESeq2, используйте DESeqDataSetFromMatrix(), DESeq()и results() функции. Ниже, типичный рабочий процесс для подражания.
        1. Microarray анализ дифференциального выражения командные строки 15 (дополнительный файл 1) см. РНК seq анализ дифференциального выражения см командные строки 16 (дополнительный файл 1). Повторите эти шаги для всех других контрастирует с другой соответствующей конструкции схемы (см. примеры на шаге 7.3.1)
    4. Из списков DEGs генерируется, извлекать все строки, которые не соответствуют ATL V1 присоединения, сохранить столбцы, содержащие log2 сбросить изменения (лечение/управления) > | 0,5 | и скорректированы p-значения (ФДР) < 0,05 и объединить их соответственно в матричную таблицу, ли исследование попадает в «абиотические» или «биотические/возбудителя взаимодействия» конспекты.
    5. Постройте иерархический кластерный карты (абиотических и биотических конспекты) в R с использованием библиотеки gplots.
      Примечание: Вызов функции heatmap.2 создает heatmap наряду с dendrograms строки из таблиц, соответствующих матрицы. Дополнительные аргументы, с помощью cellnote функции помогает различать дифференциально выраженной (log2FC > 0.5, Рузвельт < 0,05) ATL генов в каждой сравнение через широкий спектр экспериментальных условий * символ. Применить типичный рабочий процесс в R запуск командной строки 17 (дополнительный файл 1), или альтернативно, повторите шаги 6.2.2 для 6.2.5 для построения диаграммы, с помощью программного обеспечения МэВ.

    8. анализ отношений между Paralogous последовательность расхождения и Сопредседатель экспрессии генов

    1. Создание матрицы, содержащие парные сходство. Элементы матрицы подобия значений последовательность сходства рассчитывается из рядов попарных белка.
      1. Используйте EMBOSS иглы веб сервера41 с параметрами по умолчанию выравниваний последовательности попарных и сохранить как текстовый файл. Открыть выходной текстовый файл и удалите все строки комментариев, а также имена столбцов и строк для создания файла под названием «similarityTable.txt».
        Примечание: Такая таблица имеет линию для каждого гена ATL отчетности подобия значения, вычисленные в каждом из попарных выравнивание. Локусов в строках и столбцах заказ же так, что симметричная матрица создается с уважением диагональных значений.
    2. Постройте матрицу с данными совместного выражения путем расчета коэффициента корреляции Пирсона. Следующая процедура требует R и perl-модуль PDL.
      1. Скачайте выражение значения для 96 ATL гены работает командные строки 18 (дополнительный файл 1) в пределах терминала. Выполните анализ совместного выражения с помощью пользовательских perl-скрипт, который может быть загружен, запустив командные строки 19 (дополнительный файл 1). Такой сценарий будет вычислить коэффициент корреляции Пирсона между парами ATL локусов как сообщалось ранее.
      2. Запуск скрипта командной строки 20 (дополнительный файл 1) и следуйте инструкциям вывода.
    Сценарий будет производить выходной файл (а именно «coexpressionTable.txt»), содержащий матрицу совместно выражение, показывая же Локус имена порядок матрицы, полученного на шаге 8.1 (этот порядок необходимо запустить тест Mantel, см. ниже).
  • Выполните тест Mantel между матриц данных, полученных в шагах 8.1 и 8.2. После ввода среды R (выполните команду «R» в терминал), загрузить библиотеку ade4, используя следующую команду: library(ade4)
    1. Запустите тест Mantel, загрузки данных двух матриц и выполняя статистики запуска командной строки 21 (дополнительный файл 1), с «nrep», представляющий количество перестановок. Тест состоит из расчета корреляции между элементами этих матриц, permuting матриц и затем снова расчета же тестовая статистика.
      Примечание: Все полученные значения статистика теста используются для построения ссылка распределения статистика теста, который будет использоваться для вычисления p-значение для проверки на значение. Количество перестановок определяет точность, с которой p-значение может быть получено.
  • Результаты

    VIT_05s0077g01970 гена, определены как наиболее близок к A. thaliana ATL2 (At3g16720) через поиск BLASTp, был использован как зонд для обследования членов семьи ATL в геноме виноградной лозы (V. vinifera cv Pinot Noir PN40024). PSI-BLAST анализ сходились после нескольких циклов, раскрывая список предпола...

    Обсуждение

    В эпоху геномной многие семьи гена глубоко характеризовались в нескольких видов растений. Эта информация является предварительным условием для функциональных исследований и обеспечить рамки для дальнейшего изучения роли различных членов в семье. В этом контексте существует также по...

    Раскрытие информации

    Авторы не имеют ничего сообщать.

    Благодарности

    Работа была поддержана Веронский университет – в рамках совместного проекта 2014 (характеристика семьи гена ATL в виноградной лозы и ее участия в устойчивость к милдью винограда).

    Материалы

    NameCompanyCatalog NumberComments
    Personal computer
    Basic Local Alignment Search Tool (BLAST)https://blast.ncbi.nlm.nih.gov/Blast.cgi
    Molecular Evolutionary Genetics Analysis (MEGA)http://www.megasoftware.net/
    Motif-based sequence analysis tools (MEME)http://meme-suite.org/
    GeneiousBiomatters Limitedhttp://www.geneious.com/
    ProtParam Toolhttp://web.expasy.org/protparam/
    ngLOChttp://genome.unmc.edu/ngLOC/index.html
    TargetP v1.1 Serverhttp://www.cbs.dtu.dk/services/TargetP/
    Protein Prowlerhttp://bioinf.scmb.uq.edu.au:8080/pprowler_webapp_1-2/
    MUsitehttp://musite.sourceforge.net/
    Pfamhttp://pfam.xfam.org/
    TMHMM Server v. 2.0http://www.cbs.dtu.dk/services/TMHMM/
    ProtScalehttp://web.expasy.org/protscale/
    Grape Genome Database (CRIBI)http://genomes.cribi.unipd.it/grape/
    PhenoGramhttp://visualization.ritchielab.psu.edu/phenograms/plot
    MCScanXhttp://chibba.pgml.uga.edu/mcscan2/
    Interactive Tree Of Life (iTOL)http://itol.embl.de/
    UniProthttp://www.uniprot.org/
    Phylogeny.frhttp://www.phylogeny.fr/index.cgi
    MUSCLEhttp://www.ebi.ac.uk/Tools/msa/muscle/
    Gblocks Serverhttp://molevol.cmima.csic.es/castresana/Gblocks_server.html
    Vitis vinifera cv. Corvina gene expression Atlas datamatrixhttps://www.researchgate.net/publication/273383414_54sample_
    datamatrix_geneIDs_Fasoli2012
    Multi Experiment Viewer (MeV)http://mev.tm4.org/#/welcome
    Sequence Read Archive (SRA)https://www.ncbi.nlm.nih.gov/sra
    Rhttps://www.r-project.org/
    EMBOSS Needle (EMBL-EBI)http://www.ebi.ac.uk/Tools/psa/emboss_needle/

    Ссылки

    1. Jaillon, O., et al. The grapevine genome sequence suggests ancestral hexaploidization in major angiosperm phyla. Nature. 449 (7161), 463-467 (2007).
    2. Adam-Blondon, A. -. F., et al. . Genetics, Genomics, and Breeding of Grapes. , 211-234 (2011).
    3. Chen, L., Hellmann, H. Plant E3 Ligases: Flexible Enzymes in a Sessile World. Mol. Plant. 6 (5), 1388-1404 (2013).
    4. Vierstra, R. D. The ubiquitin-26S proteasome system at the nexus of plant biology. Nat. Rev. Mol. Cell Biol. 10 (6), 385-397 (2009).
    5. Serrano, M., Parra, S., Alcaraz, L. D., Guzmán, P. The ATL Gene Family from Arabidopsis thaliana and Oryza sativa Comprises a Large Number of Putative Ubiquitin Ligases of the RING-H2 Type. J. Mol. Evol. 62 (4), 434-445 (2006).
    6. Aguilar-Hernández, V., Aguilar-Henonin, L., Guzmán, P. Diversity in the Architecture of ATLs, a Family of Plant Ubiquitin-Ligases, Leads to Recognition and Targeting of Substrates in Different Cellular Environments. PLoS One. 6 (8), e23934 (2011).
    7. Guzmán, P. The prolific ATL family of RING-H2 ubiquitin ligases. Plant Signal Behav. 7 (8), 1014-1021 (2012).
    8. Grimplet, J., et al. The grapevine gene nomenclature system. BMC Genomics. 15, 1077 (2014).
    9. Prince, V. E., Pickett, F. B. Splitting pairs: the diverging fates of duplicated genes. Nat. Rev. Genet. 3 (11), 827-837 (2002).
    10. Magadum, S., Nerjee, U., Murugan, P., Gangapur, D., Ravikesavan, R. Gene duplication as a major force in evolution. J. Gen. 92 (1), 155-161 (2013).
    11. Wang, N. Patterns of Gene Duplication and Their Contribution to Expansion of Gene Families in Grapevine. Plant Mol. Biol. Rep. 31 (4), 852-861 (2013).
    12. Fasoli, M. The Grapevine Expression Atlas Reveals a Deep Transcriptome Shift Driving the Entire Plant into a Maturation Program. Plant Cell. 24 (9), 3489-3505 (2012).
    13. . BLAST2.6.0 Available from: https://blast.ncbi.nlm.nih.gov/Blast.cgi (2016)
    14. . Vitis vinifera cv. Corvina gene expression Atlas Available from: https://www.researchgate.net/publication/273383414_54sample_datamatrix_geneIDs_Fasoli2012 (2015)
    15. . Sequence Read Archive (SRA) Available from: https://www.ncbi.nlm.nih.gov/sra (2017)
    16. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
    17. Langmead, B., Salzberg, S. L. Fast gapped-read alignment with Bowtie 2. Nat Meth. 9 (4), 357-359 (2012).
    18. Anders, S., Pyl, P. T., Huber, W. HTSeq-a Python framework to work with high-throughput sequencing data. Bioinformatics. 31 (2), 166-169 (2015).
    19. . Version 3.4.1 Available from: https://www.r-project.org/ (2017)
    20. Ritchie, M. E. limma powers differential expression analyses for RNA-sequencing and microarray studies. Nucleic Acids Res. 43 (7), e47 (2015).
    21. Love, M. I., Huber, W., Anders, S. Moderated estimation of fold change and dispersion for RNA-seq data with DESeq2. Genome Biology. 15 (12), 550 (2014).
    22. Ariani, P. Genome-wide characterisation and expression profile of the grapevine ATL ubiquitin ligase family reveal biotic and abiotic stress-responsive and development-related members. Sci. Rep. 6, 38260 (2016).
    23. Vitulo, N., et al. A deep survey of alternative splicing in grape reveals changes in the splicing machinery related to tissue, stress condition and genotype. BMC Plant Biol. 14 (1), 99 (2014).
    24. Overbeek, R., Fonstein, M., D'Souza, M., Pusch, G. D., Maltsev, N. The use of gene clusters to infer functional coupling. Proc. Natl. Acad. Sci. USA. 96 (6), 2896-2901 (1999).
    25. Dalquen, D. A., Dessimoz, C. Bidirectional Best Hits Miss Many Orthologs in Duplication-Rich Clades such as Plants and Animals. Genome Biol. Evol. 5 (10), 1800-1806 (2013).
    26. Remm, M., Storm, C. E. V., Sonnhammer, E. L. L. Automatic clustering of orthologs and in-paralogs from pairwise species comparisons1. J. Mol. Biol. 314 (5), 1041-1052 (2001).
    27. Kaduk, M., Sonnhammer, E. Improved orthology inference with Hieranoid 2. Bioinformatics. 33 (8), (2017).
    28. Cramer, G. R., et al. Transcriptomic analysis of the late stages of grapevine (Vitis vinifera cv. Cabernet Sauvignon) berry ripening reveals significant induction of ethylene signaling and flavor pathways in the skin. BMC Plant Biol. 14, 370 (2014).
    29. Juretic, N., Hoen, D. R., Huynh, M. L., Harrison, P. M., Bureau, T. E. The evolutionary fate of MULE-mediated duplications of host gene fragments in rice. Genome Res. 15 (9), 1292-1297 (2005).
    30. Filichkin, S. A. Genome-wide mapping of alternative splicing in Arabidopsis thaliana. Genome Res. 20 (1), 45-58 (2010).
    31. Quesada, V., Macknight, R., Dean, C., Simpson, G. G. Autoregulation of FCA pre-mRNA processing controls Arabidopsis flowering time. EMBO J. 22 (12), 3142-3152 (2003).
    32. Wong, D. C. J., Gutierrez, R. L., Gambetta, G. A., Castellarin, S. D. Genome-wide analysis of cis-regulatory element structure and discovery of motif-driven gene co-expression networks in grapevine. DNA Res. 24 (3), 311-326 (2017).
    33. Wong, D. C. J., Matus, J. T. Constructing Integrated Networks for Identifying New Secondary Metabolic Pathway Regulators in Grapevine: Recent Applications and Future Opportunities. Front. Plant Sci. 8, 505 (2017).

    Перепечатки и разрешения

    Запросить разрешение на использование текста или рисунков этого JoVE статьи

    Запросить разрешение

    Смотреть дополнительные статьи

    130ATL E3

    This article has been published

    Video Coming Soon

    JoVE Logo

    Исследования

    Образование

    О JoVE

    Авторские права © 2025 MyJoVE Corporation. Все права защищены