Для просмотра этого контента требуется подписка на Jove Войдите в систему или начните бесплатную пробную версию.
Method Article
Целью этого протокола является исследование эволюции и экспрессии генов-кандидатов с использованием данных секвенирования РНК.
Дистилляция и представление больших наборов данных, таких как данные всего генома или транскриптома, часто является сложной задачей. Один из способов разбить результаты — сосредоточиться на одном или нескольких семействах генов, которые важны для организма и исследования. В этом протоколе мы описываем биоинформативные шаги для создания филогении и количественной оценки экспрессии генов, представляющих интерес. Филогенетические деревья могут дать представление о том, как гены развиваются внутри и между видами, а также выявить орфографию. Эти результаты могут быть улучшены с использованием данных RNA-seq для сравнения экспрессии этих генов у разных людей или тканей. Исследования молекулярной эволюции и экспрессии могут выявить способы эволюции и сохранения функции генов между видами. Характеристика семейства генов может служить трамплином для будущих исследований и может выделить важное семейство генов в новом геноме или транскриптоме.
Достижения в области технологий секвенирования облегчили секвенирование геномов и транскриптомов немоделированных организмов. В дополнение к повышенной возможности секвенирования ДНК и РНК от многих организмов, обилие данных является общедоступным для изучения генов, представляющих интерес. Целью этого протокола является предоставление биоинформатических шагов для исследования молекулярной эволюции и экспрессии генов, которые могут играть важную роль в интересуемом организме.
Исследование эволюции гена или семейства генов может дать представление об эволюции биологических систем. Члены семейства генов обычно определяются путем идентификации сохраненных мотивов или гомологичных последовательностей генов. Эволюция семейства генов ранее исследовалась с использованием геномов отдаленно связанных модельных организмов1. Ограничением этого подхода является то, что неясно, как эти семейства генов развиваются у близкородственных видов и роль различных селективных давлений окружающей среды. В этот протокол мы включаем поиск гомологов у близкородственных видов. Генерируя филогенез на уровне типа, мы можем отметить тенденции в эволюции семейства генов, такие как сохранение генов или дупликации, специфичные для линии. На этом уровне мы также можем исследовать, являются ли гены ортологами или паралогами. Хотя многие гомологи, вероятно, функционируют аналогично друг другу, это не обязательно так2. Включение филогенетических деревьев в эти исследования важно для решения вопроса о том, являются ли эти гомологичные гены ортологами или нет. У эукариот многие ортологи сохраняют аналогичные функции внутри клетки, о чем свидетельствует способность белков млекопитающих восстанавливать функцию дрожжевых ортологов3. Однако есть случаи, когда неортологичный ген выполняет характерную функцию4.
Филогенетические деревья начинают очертивать отношения между генами и видами, но функция не может быть назначена исключительно на основе генетических связей. Исследования экспрессии генов в сочетании с функциональными аннотациями и анализом обогащения обеспечивают сильную поддержку функции генов. Случаи, когда экспрессия генов может быть количественно оценена и сравнена между людьми или типами тканей, могут быть более показательными для потенциальной функции. Следующий протокол следует методам, используемым при исследовании генов опсина в Hydra vulgaris7,но они могут быть применены к любому виду и любому семейству генов. Результаты таких исследований обеспечивают основу для дальнейшего изучения функции генов и генных сетей в немоделовых организмах. В качестве примера, исследование филогении опсинов, которые являются белками, которые инициируют каскад фототрансдукции, дает контекст эволюции глаз и обнаружения света8,9,10,11. В этом случае немодельные организмы, особенно базальные виды животных, такие как книдарии или гребневицы, могут прояснить сохранение или изменения в каскаде фототрансдукции и зрения черезклады 12,13,14. Точно так же определение филогении, экспрессии и сетей других семейств генов проинформирует нас о молекулярных механизмах, лежащих в основе адаптаций.
Этот протокол следует рекомендациям по уходу за животными UC Irvine.
1. Подготовка библиотеки РНК-seq
2. Доступ к кластеру компьютеров
ПРИМЕЧАНИЕ: Анализ RNA-seq требует манипуляций с большими файлами и лучше всего выполняется на компьютерном кластере (Таблица материалов).
3. Получение считывания РНК-seq
4. Обрезка адаптеров и некачественные считываемые материалы (опционально)
5. Получение эталонной сборки
6. Создание сборки de novo (альтернатива шагу 5)
7. Карта считывается с геномом (7.1) или de novo транскриптомом (7.2)
8. Определите гены, представляющие интерес
ПРИМЕЧАНИЕ: Следующие шаги могут быть выполнены с нуклеотидными или белковыми файлами FASTA, но работают лучше всего и более просты с белковыми последовательностями. Поиск BLAST с использованием белка к белку с большей вероятностью даст результаты при поиске между различными видами.
9. Филогенетические деревья
10. Визуализация экспрессии генов с помощью доверенного платформенного модуля
Приведенные выше методы обобщены на рисунке 1 и были применены к набору данных тканей Hydra vulgaris. H. vulgaris является пресноводным беспозвоночным, которое принадлежит к типу Cnidaria, который также включает кораллы, медузы и морские анемоны. H. vulgaris может размнож...
Цель этого протокола состоит в том, чтобы дать краткое описание шагов для характеристики семейства генов с использованием данных RNA-seq. Было доказано, что эти методы работают для различных видов и наборов данных4,34,35. Созданный здесь кон?...
Авторам нечего раскрывать.
Мы благодарим Адриану Бриско, Гила Смита, Раби Мурада и Алин Г. Рангел за советы и рекомендации по включению некоторых из этих шагов в наш рабочий процесс. Мы также благодарны Кэтрин Уильямс, Элизабет Реббоа и Наташе Пиччиани за комментарии к рукописи. Эта работа была частично поддержана стипендией Фонда Джорджа Э. Хьюитта для медицинских исследований A.M.M.
Name | Company | Catalog Number | Comments |
Bioanalyzer-DNA kit | Agilent | 5067-4626 | wet lab materials |
Bioanalyzer-RNA kit | Agilent | 5067-1513 | wet lab materials |
BLAST+ v. 2.8.1 | On computer cluster* https://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/ | ||
Blast2GO (on your PC) | On local computer https://www.blast2go.com/b2g-register-basic | ||
boost v. 1.57.0 | On computer cluster | ||
Bowtie v. 1.0.0 | On computer cluster https://sourceforge.net/projects/bowtie-bio/files/bowtie/1.3.0/ | ||
Computing cluster (highly recommended) | NOTE: Analyses of genomic data are best done on a high-performance computing cluster because files are very large. | ||
Cufflinks v. 2.2.1 | On computer cluster | ||
edgeR v. 3.26.8 (in R) | In Rstudio https://bioconductor.org/packages/release/bioc/html/edgeR.html | ||
gcc v. 6.4.0 | On computer cluster | ||
Java v. 11.0.2 | On computer cluster | ||
MEGA7 (on your PC) | On local computer https://www.megasoftware.net | ||
MEGAX v. 0.1 | On local computer https://www.megasoftware.net | ||
NucleoSpin RNA II kit | Macherey-Nagel | 740955.5 | wet lab materials |
perl 5.30.3 | On computer cluster | ||
python | On computer cluster | ||
Qubit 2.0 Fluorometer | ThermoFisher | Q32866 | wet lab materials |
R v.4.0.0 | On computer cluster https://cran.r-project.org/src/base/R-4/ | ||
RNAlater | ThermoFisher | AM7021 | wet lab materials |
RNeasy kit | Qiagen | 74104 | wet lab materials |
RSEM v. 1.3.0 | Computer software https://deweylab.github.io/RSEM/ | ||
RStudio v. 1.2.1335 | On local computer https://rstudio.com/products/rstudio/download/#download | ||
Samtools v. 1.3 | Computer software | ||
SRA Toolkit v. 2.8.1 | On computer cluster https://github.com/ncbi/sra-tools/wiki/01.-Downloading-SRA-Toolkit | ||
STAR v. 2.6.0c | On computer cluster https://github.com/alexdobin/STAR | ||
StringTie v. 1.3.4d | On computer cluster https://ccb.jhu.edu/software/stringtie/ | ||
Transdecoder v. 5.5.0 | On computer cluster https://github.com/TransDecoder/TransDecoder/releases | ||
Trimmomatic v. 0.35 | On computer cluster http://www.usadellab.org/cms/?page=trimmomatic | ||
Trinity v.2.8.5 | On computer cluster https://github.com/trinityrnaseq/trinityrnaseq/releases | ||
TRIzol | ThermoFisher | 15596018 | wet lab materials |
TruSeq RNA Library Prep Kit v2 | Illumina | RS-122-2001 | wet lab materials |
TURBO DNA-free Kit | ThermoFisher | AM1907 | wet lab materials |
*Downloads and installation on the computer cluster may require root access. Contact your network administrator. |
Запросить разрешение на использование текста или рисунков этого JoVE статьи
Запросить разрешениеThis article has been published
Video Coming Soon
Авторские права © 2025 MyJoVE Corporation. Все права защищены