JoVE Logo

登录

需要订阅 JoVE 才能查看此. 登录或开始免费试用。

本文内容

  • 摘要
  • 摘要
  • 引言
  • 研究方案
  • 结果
  • 讨论
  • 披露声明
  • 致谢
  • 材料
  • 参考文献
  • 转载和许可

摘要

本协议的目的是使用RNA测序数据调查候选基因的进化和表达。

摘要

蒸馏和报告大型数据集(如全基因组或转录组数据)往往是一项艰巨的任务。分解结果的一种方法是关注一个或多个对生物体和研究具有重要意义的基因家族。在此协议中,我们概述了生物信息学步骤,以生成植物学并量化感兴趣的基因表达。植物遗传树可以深入了解基因在物种内部和物种之间是如何进化的,并揭示正学。这些结果可以使用RNA-seq数据来比较这些基因在不同个体或组织中的表达。分子进化和表达的研究可以揭示物种间基因功能的进化和保存模式。基因家族的特征可以作为未来研究的跳板,并能在新的基因组或转录纸中突出一个重要的基因家族。

引言

测序技术的进步促进了非模型生物基因组和转录组的测序。除了从许多生物体中测序DNA和RNA的可行性增加外,还有大量数据可供公开研究感兴趣的基因。本议定书的目的是提供生物信息学步骤,以研究基因的分子进化和表达,这些基因可能在感兴趣的有机体中发挥重要作用。

研究基因或基因家族的进化可以深入了解生物系统的进化。基因家族的成员通常通过识别保存的图案或同源基因序列来确定。基因家族进化以前是利用来自遥远相关模型生物体1的基因组进行研究的。这种方法的一个局限性是,不清楚这些基因家族是如何在密切相关的物种中进化的,以及不同环境选择性压力的作用。在此协议中,我们包括在密切相关的物种中搜索同源物种。通过在植物水平上生成植物,我们可以注意到基因家族进化的趋势,如保存的基因或特定于血统的复制。在这个水平上,我们也可以调查基因是正石还是对等体。虽然许多同源可能彼此类似,但情况不一定如此在这些研究中加入植物遗传树对于确定这些同源基因是否是正交者非常重要。在真核生物中,许多矫形器在细胞内保留着类似的功能,哺乳动物蛋白质恢复酵母组织细胞3的功能的能力就证明了这一点。然而,在某些情况下,非正直面基因具有特征功能4。

植物树开始描绘基因和物种之间的关系,但功能不能仅仅根据遗传关系来分配。基因表达研究与功能注释和富集分析相结合,为基因功能提供了强有力的支持。基因表达可以跨个体或组织类型进行量化和比较的案例可以更能说明潜在的功能。以下协议遵循的方法,用于研究在海德拉粗俗7的蛋白基因,但他们可以应用于任何物种和任何基因家族。这些研究的结果为进一步研究非模型生物的基因功能和基因网络奠定了基础。例如,对蛋白的植物学研究,这些蛋白是引发光转移级联的蛋白质,为眼睛和光检测进化提供了背景。在这种情况下,非模型生物,特别是基础动物物种,如神经元或细胞,可以阐明保护或变化的光转移级联和视觉跨越包12,13,14。同样,确定其他基因家族的植物学、表达和网络将告诉我们适应背后的分子机制。

研究方案

该协议遵循加州大学欧文分校的动物护理指南。

1. RNA-塞克图书馆准备

  1. 使用以下方法分离RNA。
    1. 收集样本。如果RNA要在以后提取,闪光冻结样品或放置在RNA存储解决方案15(材料表)。
    2. 安乐死和解剖生物体,以分离感兴趣的组织。
    3. 使用提取套件提取总RNA,使用RNA净化套件(材料表)净化RNA
      注:有协议和工具包,可能更好地适用于不同的物种和组织类型16,17。我们已经从蝴蝶18和明胶海德拉19的不同身体组织提取RNA(见讨论)。
    4. 测量每个样品(材料表)的RNA浓度和质量。使用RNA完整性编号(RIN)高于8的样本,最好接近920 来构建cDNA库。
  2. 构建 cDNA 库并按以下顺序排列。
    1. 根据库准备说明手册构建 cDNA 库(参见讨论)。
    2. 确定 cDNA 浓度和质量 (材料表)。
    3. 将库多路复用并排序。

2. 访问计算机群集

注:RNA-seq 分析需要操作大型文件,最好在计算机集群(材料表)上完成。

  1. 使用终端 (Mac) 或 PuTTY (Windows) 应用窗口上的命令 ssh username@clusterlocation 登录计算机集群帐户。

3. 获取RNA-塞克读数

  1. 从测序设施获取RNA-seq读取,或者,对于出版物中生成的数据,从存放数据库(3.2 或 3.3)获取 RNA-seq 读数。
  2. 要从阵列快报等存储库下载数据,请执行以下工作:
    1. 使用加入号码搜索网站。
    2. 查找下载数据的链接,然后左键单击并选择 "复制链接"。
    3. 在终端窗口上,键入 wget 并选择 粘贴链接 以将数据复制到目录进行分析。
  3. 要下载 NCBI 短读存档 (SRA) 数据,请遵循以下替代步骤:
    1. 在终端下载SRA工具包诉2.8.1使用wget。
      注意:下载和安装计算机集群的程序可能需要根访问,如果安装失败,请联系计算机集群管理员。
    2. 通过键入 焦油-xvf$TARGZFILE完成程序的安装。
    3. 搜索NCBI的SRA加入号码的样品,你想下载,它应该有格式SRRXX。
    4. 通过在终端窗口中键入 [sratoolkit 位置]/bin/预装 SRRXXXX 来获取 RNA-seq 数据。
    5. 对于配对端文件类型 [sratoolkit 位置]/bin/快速转储 - 拆分文件 SRRXXXXXX 以获取两个快速文件(SRRXXXXXX_1.FASTQ 和SRRXXXXXX_2.FASTQ)。
      注意:要进行三位一体 的 novo 装配,请使用命令 [sratoolkit 位置]/bin/fastq-dump - 定义 -seq "@$sn]]/$ri" - 拆分文件 SRRXXXX

4. 修剪适配器和低质量读数(可选)

  1. 在计算集群上安装或加载修剪21 诉 0.35。
  2. 在 RNA-seq 数据文件所在的目录中,键入一个命令,包括修剪罐文件的位置、输入 FASTQ 文件、输出 FASTQ 文件以及读取长度和质量等可选参数。
    注:命令将因原始和所需的读取质量和长度而异。对于 Illumina 43 bp 读取与 Nextera 引物, 我们使用: java - jar / 数据 / 应用程序 / 修剪 / 0.35 / 修剪 - 0.35.jar PE $READ 1 。快速Q$READ 2。快速paired_READ1。快速unpaired_READ1。快速paired_READ2。快速unpaired_READ2。FASTQ 照明:适配器.fa:2:30:10 领先:20 落后:20 滑动窗口:4:17 分钟:30。

5. 获取参考组件

  1. 搜索谷歌,恩塞姆布尔基因组,和NCBI基因组和核苷酸TSA(脚本猎枪组装)的参考基因组或组装转录的感兴趣的物种(图1)。
    注意:如果参考基因组或转录组不可用或质量低劣,请转到步骤 6 生成 de novo 组装。
  2. 如果存在参考基因组或组装的转录组,请将其下载为快速文件,以便按照以下步骤进行分析。
    1. 查找下载基因组的链接,左键单击和 复制链接
    2. 在终端窗口类型上 获取 并粘贴链接地址。如果可用,也复制 GTF 文件和蛋白质 FASTA 文件作为参考基因组。

6. 生成 无组 件(第 5 步的替代方案)

  1. 通过键入猫*READ1,将RNA-seq READ1和READ2快速q文件组合在一起,用于所有样本。快速Q> $all_READ1。快速Q猫*阅读2。快速> all_READ2。终端窗口上的快速Q。
  2. 在计算集群上安装或加载三位一 体 22 v.2.8.5。
  3. 通过在终端上键入生成和组装: 三一 - seqType fq - max_memory 20G - 左$all_READ1。快速Q - 右$all_READ2。快速Q。

7. 地图读取基因组 (7.1) 或 de novo 转录体 (7.2)

  1. 地图使用 STAR23 v. 2.6.0c 和 RSEM24 v. 1.3.0 读取参考基因组。
    1. 安装或加载 STAR 诉 2.6.0c.和RSEM诉1.3.0到计算集群。
    2. 通过键入 rsem 准备参考 - gtf $GENOME来索引基因组。GTF -星-p 16$GENOME。法斯塔$OUTPUT
    3. 地图通过键入 rsem 计算表达 -p 16 - 星 - 配对端$READ 1 来读取和计算每个示例的表达式。快速Q$READ 2。快速$INDEX $OUTPUT。
    4. 使用mv RSEM.genes.结果$sample.基因.结果将结果文件重命名为具有描述性的东西。
    5. 通过键入 rsem 生成数据矩阵 *[基因/等形结果.结果] > $OUTPUT生成所有计数的矩阵。
  2. 使用 RSEM 和蝴蝶结将 RNA-seq 映射到 三一德诺沃 装配。
    1. 安装或加载三位一体22 v.2.8.5、鲍蒂25 诉 1.0.0 和 RSEM v. 1.3.0。
    2. 地图通过键入 [trinity_location] /align_and_estimate_abundance.pl - 准备参考 - 脚本$TRINITY来读取和计算每个示例的表达式。法斯塔 -塞克类型fq-左$READ 1。快速Q -右$READ 2。快速 - est_method Rsem - aln_method蝴蝶结 - trinity_mode - output_dir $OUTPUT。
    3. 使用mv RSEM.genes.结果$sample.基因.结果将结果文件重命名为具有描述性的东西。
    4. 通过键入 [trinity_location]/abundance_estimates_to_matrix.pl 生成所有计数的矩阵 - est_method RSEM *[基因/等形]。

8. 识别感兴趣的基因

注意:以下步骤可以与核苷酸或蛋白质FASTA文件一起完成,但工作最好,并且对蛋白质序列更直接。使用蛋白质对蛋白质进行爆炸搜索更有可能在不同物种之间搜索时给出结果。

  1. 对于参考基因组,请使用 STEP 5.2.2 中的蛋白质 FASTA 文件或查看补充材料生成自定义基因特征 GTF。
  2. 对于 一个无 转录机,使用转编码器生成蛋白质FASTA。
    1. 在计算机粘贴机上安装或加载转解编码器 v. 5.5.0。
    2. 通过键入 [转译器位置]/转译器.LongOrfs-t $TRINITY,找到最长的开放读取帧并预测肽序列。法斯塔
  3. 搜索NCBI基因库,寻找密切相关物种中的同源物种。
    1. 打开互联网浏览器窗口,转到 https://www.ncbi.nlm.nih.gov/genbank/。
    2. 在搜索栏上键入感兴趣的基因的名称和已测序的密切相关物种的名称或属或植物。在搜索栏的左侧选择蛋白质,然后单击搜索。
    3. 通过单击 "发送"然后 选择 "文件" 提取序列。在格式下,选择 FASTA 然后单击 "创建文件"。
    4. 通过在本地终端窗口上键入 scp $FASTA username@clusterlocation/$DIR, 或使用 FileZilla 将文件传输到计算机和集群,将同源文件移动到计算机群集。
  4. 使用 BLAST+26搜索候选基因。
    1. 在计算机集群上安装或加载 BLAST® v. 2.8.1。
    2. 在计算机群集上,通过键入 [BLAST]位置]/使blastdb-在$PEP中,从基因组或转录组翻译的蛋白质FASTA中建立一个BLAST数据库。法斯塔 -db 型原型 - 出$OUTPUT
    3. 通过键入 [BLAST] 位置] / 爆炸 - db $DATABASE - 查询 $FASTA - 价值 1e-10 - outfmt 6 - max_target_seqs 1 - 出$OUTPUT,将 NCBI 的同源基因序列爆炸到感兴趣的物种数据库中。
    4. 使用更多命令查看输出文件。将感兴趣的物种中的独特基因 ID 复制到新的文本文件中。
    5. 通过键入 per-ne"如果(//>(\S+)\$c=$i=1}$c打印:chomp;$i==1,如果@ARGV"$gene_id.txt $PEP,提取候选基因的序列。法斯塔> $OUTPUT
  5. 使用对等爆炸确认基因注释。
    1. 在互联网上浏览器上转到 https://blast.ncbi.nlm.nih.gov/Blast.cgi。
    2. 选择tblastn,然后粘贴候选序列,选择非冗余蛋白质序列数据库并单击BLAST。
  6. 通过用基因本体 (GO) 术语注释基因组或转录组中的所有基因来识别其他基因(参见讨论)。
    1. 将蛋白质 FASTA 转移到本地计算机。
    2. 下载并安装 Blast2GO27、2829诉 5.2 到本地计算机。
    3. 打开 Blast2GO,单击 文件, 转到 加载, 转到 加载序列, 单击 加载快速文件 (fasta).选择 FASTA 文件并单击 "加载"。
    4. 点击 爆炸, 选择 NCBI爆炸,并点击 下一步。编辑参数或单击 "下一步",编辑参数并单击 "运行" 以查找最相似的基因描述。
    5. 单击映射,然后单击 Run 以搜索基因本体论注释中类似的蛋白质。
    6. 下一个单击 互程序,选择 EMBL-EBI互程序,然后单击 下一个。编辑参数或单击 "下一步",然后单击 "运行" 以搜索已知基因家族和域的签名。
    7. 通过单击 文件导出注释,选择 导出,单击 "导出表"。单击 "浏览",命名文件,单击 "保存",单击 "导出"。
    8. 搜索注释表以查找 GO 感兴趣的术语,以确定其他候选基因。从 FASTA 文件中提取序列(STEP 8.4.5)

9. 植物树

  1. 下载并安装MEGA30 诉7.0.26到您的本地计算机。
  2. 打开MEGA,点击 对齐,点击 编辑/构建对齐,选择 创建一个新的对齐 点击 确定,选择 蛋白质
  3. 当对齐窗口打开时,单击 "编辑",单击 文件中的"插入"序列 ,然后选择具有候选基因和可能同源基因的蛋白质序列的 FASTA。
  4. 选择所有序列。找到手臂符号并悬停在它上。它应该说使用MUSCLE31 算法对齐序列。单击手臂符号,然后单击 "对齐蛋白 "以对齐序列。编辑参数或单击 "确定" 以使用默认参数对齐。
  5. 目视检查并进行任何手动更改,然后保存并关闭对齐窗口。
  6. 在主MEGA窗口中,单击 模型,单击 "查找最佳DNA/蛋白质模型"(ML),选择对齐文件并选择相应的参数,如: 分析:模型选择(ML)、树使用:自动(邻接树)、统计方法:最大可能性、替代类型:氨基酸、间隙/缺失数据处理:使用所有站点、分支站点筛选:无。
  7. 确定数据的最佳模型后,转到主要的 MEGA 窗口。单击 Phylogeny, 然后单击 "构造/测试最大可能性树 ",然后在必要时选择对齐。为树选择适当的参数: 统计方法:最大可能性,植物学测试:100个复制品的引导方法,替代类型:氨基酸,模型:LG与Freqs。(+F),网站之间的速率:伽马分布(G)与5个离散伽马类别,差距/缺失的数据处理:使用所有站点,ML启发式方法:最近邻居交换(NNI)。

10. 使用 TPM 可视化基因表达

  1. 对于三一,在计算机群集上转到 运行abundance_estimates_to_matrix.pl 目录,其中一个输出应该是矩阵。TPM.not_cross_norm将此文件传输到本地计算机。
    注:有关交叉样本规范化,请参阅补充材料。
  2. 对于来自基因组分析的 TPM,请遵循以下步骤。
    1. 在计算机群集上,转到 RSEM 安装位置。通过键入 scp rsem 生成-数据-矩阵-生成-TPM-矩阵,复制 rsem 生成-数据-矩阵。使用 nano 编辑新文件并将 TPM 的"我的$offsite = 4"从 4 更改为 5,现在应读取"我的$offsite = 5"。
  3. 转到 RSEM 输出文件 .genes.结果所在的目录,现在使用 rsem 生成 -TPM-矩阵 *[基因/等形体.结果] > $OUTPUT 生成 TPM 矩阵。将结果传输到本地计算机。
  4. 在格普洛特2中可视化结果。
    1. 将 R 诉 4.0.0 和 RStudio v. 1.2.1335 下载到本地计算机。
    2. 打开屏幕右侧的 RStudio 转到 "封装 "选项卡并单击 "安装"。键入 ggplot2 并单击 安装
    3. 在 TPM 表中通过键入数据读取的 R 脚本窗口 <读.table("$tpm.txt",标题 = T)
    4. 对于类似于 图 4类型的条形图,类似 :p<- ggplot () = geom_bar(aes(y=TPM,x=符号,填充=组织),数据=数据,统计="身份")
      填写
      p<-p]scale_fill_manual(值=填充)
      p + 主题 (轴. 文本. x = element_text (角度 = 90) )

结果

上述方法在 图1 中总结,并应用于 海德拉粗俗 组织的数据集。 H. 粗俗 是一种淡水无脊椎动物,属于植物 其中也包括珊瑚、水母和海葵。 低俗者 可以通过萌芽无性繁殖,在被分割时可以再生头部和脚部。在这项研究中,我们旨在研究 海德拉7号中蛋白基因的进化和表达。虽然 海德拉 缺乏眼睛,他们表现出光依?...

讨论

本协议的目的是提供使用RNA-seq数据描述基因家族的步骤大纲。这些方法已被证明适用于各种物种和数据集4,34,35。这里建立的管道已经简化,应该很容易,随后是生物信息学的新手。该协议的意义在于,它概述了完成可发布分析的所有步骤和必要程序。协议中的一个关键步骤是正确组装全长成绩单,这来自高质量的基因组或...

披露声明

作者没有什么可透露的。

致谢

我们感谢阿德里亚娜·布里斯科、吉尔·史密斯、拉比·穆拉德和艾琳·兰赫尔在将其中一些步骤纳入我们的工作流程方面提供的建议和指导。我们也感谢凯瑟琳·威廉姆斯、伊丽莎白·雷博亚和娜塔莎·皮恰尼对手稿的评论。这项工作部分得到了乔治·休伊特医学研究基金会对A.M.M的支持。

材料

NameCompanyCatalog NumberComments
Bioanalyzer-DNA kitAgilent5067-4626wet lab materials
Bioanalyzer-RNA kitAgilent5067-1513wet lab materials
BLAST+ v. 2.8.1On computer cluster*
https://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/
Blast2GO (on your PC)On local computer
https://www.blast2go.com/b2g-register-basic
boost v. 1.57.0On computer cluster
Bowtie v. 1.0.0On computer cluster
https://sourceforge.net/projects/bowtie-bio/files/bowtie/1.3.0/
Computing cluster (highly recommended)NOTE: Analyses of genomic data are best done on a high-performance computing cluster because files are very large.
Cufflinks v. 2.2.1On computer cluster
edgeR v. 3.26.8 (in R)In Rstudio
https://bioconductor.org/packages/release/bioc/html/edgeR.html
gcc v. 6.4.0On computer cluster
Java v. 11.0.2On computer cluster
MEGA7 (on your PC)On local computer
https://www.megasoftware.net
MEGAX v. 0.1On local computer
https://www.megasoftware.net
NucleoSpin RNA II kitMacherey-Nagel740955.5wet lab materials
perl 5.30.3On computer cluster
pythonOn computer cluster
Qubit 2.0 FluorometerThermoFisherQ32866wet lab materials
R v.4.0.0On computer cluster
https://cran.r-project.org/src/base/R-4/
RNAlaterThermoFisherAM7021wet lab materials
RNeasy kitQiagen74104wet lab materials
RSEM v. 1.3.0Computer software
https://deweylab.github.io/RSEM/
RStudio v. 1.2.1335On local computer
https://rstudio.com/products/rstudio/download/#download
Samtools v. 1.3Computer software
SRA Toolkit v. 2.8.1On computer cluster
https://github.com/ncbi/sra-tools/wiki/01.-Downloading-SRA-Toolkit
STAR v. 2.6.0cOn computer cluster
https://github.com/alexdobin/STAR
StringTie v. 1.3.4dOn computer cluster
https://ccb.jhu.edu/software/stringtie/
Transdecoder v. 5.5.0On computer cluster
https://github.com/TransDecoder/TransDecoder/releases
Trimmomatic v. 0.35On computer cluster
http://www.usadellab.org/cms/?page=trimmomatic
Trinity v.2.8.5On computer cluster
https://github.com/trinityrnaseq/trinityrnaseq/releases
TRIzolThermoFisher15596018wet lab materials
TruSeq RNA Library Prep Kit v2IlluminaRS-122-2001wet lab materials
TURBO DNA-free KitThermoFisherAM1907wet lab materials
*Downloads and installation on the computer cluster may require root access. Contact your network administrator.

参考文献

  1. Lespinet, O., Wolf, Y. I., Koonin, E. V., Aravind, L. The role of lineage-specific gene family expansion in the evolution of eukaryotes. Genome Research. 12 (7), 1048-1059 (2002).
  2. Gabaldón, T., Koonin, E. V. Functional and evolutionary implications of gene orthology. Nature Reviews Genetics. 14 (5), 360-366 (2013).
  3. Dolinski, K., Botstein, D. Orthology and Functional Conservation in Eukaryotes. Annual Review of Genetics. 41 (1), (2007).
  4. Macias-Muñoz, A., McCulloch, K. J., Briscoe, A. D. Copy number variation and expression analysis reveals a non-orthologous pinta gene family member involved in butterfly vision. Genome Biology and Evolution. 9 (12), 3398-3412 (2017).
  5. Cannon, S. B., Mitra, A., Baumgarten, A., Young, N. D., May, G. The roles of segmental and tandem gene duplication in the evolution of large gene families in Arabidopsis thaliana. BMC plant biology. 4, 10 (2004).
  6. Eastman, S. D., Chen, T. H. P., Falk, M. M., Mendelson, T. C., Iovine, M. K. Phylogenetic analysis of three complete gap junction gene families reveals lineage-specific duplications and highly supported gene classes. Genomics. 87 (2), 265-274 (2006).
  7. Macias-Munõz, A., Murad, R., Mortazavi, A. Molecular evolution and expression of opsin genes in Hydra vulgaris. BMC Genomics. 20 (1), 1-19 (2019).
  8. Hisatomi, O., Tokunaga, F. Molecular evolution of proteins involved in vertebrate phototransduction. Comparative Biochemistry and Physiology - B Biochemistry and Molecular Biology. 133 (4), 509-522 (2002).
  9. Arendt, D. Evolution of eyes and photoreceptor cell types. International Journal of Developmental Biology. 47, 563-571 (2003).
  10. Shichida, Y., Matsuyama, T. Evolution of opsins and phototransduction. Philosophical Transactions of the Royal Society B: Biological Sciences. 364 (1531), 2881-2895 (2009).
  11. Porter, M. L., et al. Shedding new light on opsin evolution. Proceedings of the Royal Society B: Biological Sciences. 279 (1726), 3-14 (2012).
  12. Plachetzki, D. C., Degnan, B. M., Oakley, T. H. The origins of novel protein interactions during animal opsin evolution. PLoS ONE. 2 (10), 1054 (2007).
  13. Ramirez, M. D., et al. The last common ancestor of most bilaterian animals possessed at least nine opsins. Genome Biology and Evolution. 8 (12), 3640-3652 (2016).
  14. Schnitzler, C. E., et al. Genomic organization, evolution, and expression of photoprotein and opsin genes in Mnemiopsis leidyi: a new view of ctenophore photocytes. BMC Biology. 10, 107 (2012).
  15. Pedersen, K. B., Williams, A., Watt, J., Ronis, M. J. Improved method for isolating high-quality RNA from mouse bone with RNAlater at room temperature. Bone Reports. 11, 100211 (2019).
  16. Ridgeway, J. A., Timm, A. E., Fallon, A. Comparison of RNA isolation methods from insect larvae. Journal of Insect Science. 14 (1), 4-8 (2014).
  17. Scholes, A. N., Lewis, J. A. Comparison of RNA isolation methods on RNA-Seq: Implications for differential expression and meta-Analyses. BMC Genomics. 21 (1), 1-9 (2020).
  18. Briscoe, A. D., et al. Female behaviour drives expression and evolution of gustatory receptors in butterflies. PLoS genetics. 9 (7), 1003620 (2013).
  19. Murad, R., Macias-Muñoz, A., Wong, A., Ma, X., Mortazavi, A. Integrative analysis of Hydra head regeneration reveals activation of distal enhancer-like elements. bioRxiv. , 544049 (2019).
  20. Gallego Romero, I., Pai, A. A., Tung, J., Gilad, Y. Impact of RNA degradation on measurements of gene expression. BMC Biology. 12, 42 (2014).
  21. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  22. Trinity. . RNA-Seq De novo Assembly Using Trinity. , 1-7 (2014).
  23. Dobin, A., et al. STAR: ultrafast universal RNA-seq aligner. Bioinformatics. 29, 15-21 (2013).
  24. Li, B., Dewey, C. N. RSEM: accurate transcript quantification from RNA-Seq data with or without a reference genome. BMC bioinformatics. 12, 323 (2011).
  25. Langmead, B., Trapnell, C., Pop, M., Salzberg, S. L. Ultrafast and memory-efficient alignment of short DNA sequences to the human genome. Genome biology. 10, 25 (2009).
  26. Camacho, C., et al. BLAST+: architecture and applications. BMC Bioinformatics. 10, 421 (2009).
  27. Conesa, A., Götz, S. Blast2GO: A comprehensive suite for functional analysis in plant genomics. International Journal of Plant Genomics. 619832, (2008).
  28. Conesa, A., et al. Blast2GO: A universal tool for annotation, visualization and analysis in functional genomics research. Bioinformatics. 21 (18), 3674-3676 (2005).
  29. Götz, S., et al. High-throughput functional annotation and data mining with the Blast2GO suite. Nucleic Acids Research. 36 (10), 3420-3435 (2008).
  30. Kumar, S., Stecher, G., Tamura, K. MEGA7: Molecular Evolutionary Genetics Analysis version 7.0 for bigger datasets. Molecular biology and evolution. 33 (7), 1870-1874 (2016).
  31. Edgar, R. C. MUSCLE: Multiple sequence alignment with high accuracy and high throughput. Nucleic Acids Research. 32 (5), 1792-1797 (2004).
  32. Taddei-Ferretti, C., Musio, C., Santillo, S., Cotugno, A. The photobiology of Hydra's periodic activity. Hydrobiologia. 530, 129-134 (2004).
  33. Chapman, J. A., et al. The dynamic genome of Hydra. Nature. 464 (7288), 592-596 (2010).
  34. Macias-Muñoz, A., Rangel Olguin, A. G., Briscoe, A. D. Evolution of phototransduction genes in Lepidoptera. Genome Biology and Evolution. 11 (8), 2107-2124 (2019).
  35. Macias-Munõz, A., Murad, R., Mortazavi, A. Molecular evolution and expression of opsin genes in Hydra vulgaris. BMC Genomics. 20 (1), (2019).
  36. Picelli, S., et al. Full-length RNA-seq from single cells using Smart-seq2. Nature Protocols. 9 (1), 171-181 (2014).
  37. Tavares, L., Alves, P. M., Ferreira, R. B., Santos, C. N. Comparison of different methods for DNA-free RNA isolation from SK-N-MC neuroblastoma. BMC research notes. 4, 3 (2011).
  38. Johnson, M. T. J., et al. Evaluating Methods for Isolating Total RNA and Predicting the Success of Sequencing Phylogenetically Diverse Plant Transcriptomes. PLoS ONE. 7 (11), (2012).
  39. Zhao, S., Zhang, Y., Gamini, R., Zhang, B., Von Schack, D. Evaluation of two main RNA-seq approaches for gene quantification in clinical RNA sequencing: PolyA+ selection versus rRNA depletion. Scientific Reports. 8 (1), 1-12 (2018).
  40. Zhao, S., et al. Comparison of stranded and non-stranded RNA-seq transcriptome profiling and investigation of gene overlap. BMC Genomics. 16 (1), 1-14 (2015).
  41. Corley, S. M., MacKenzie, K. L., Beverdam, A., Roddam, L. F., Wilkins, M. R. Differentially expressed genes from RNA-Seq and functional enrichment results are affected by the choice of single-end versus paired-end reads and stranded versus non-stranded protocols. BMC Genomics. 18 (1), 1-13 (2017).
  42. Haas, B. J., et al. De novo transcript sequence reconstruction from RNA-seq using the Trinity platform for reference generation and analysis. Nature Protocols. 8 (8), 1494-1512 (2013).
  43. Pertea, M., et al. StringTie enables improved reconstruction of a transcriptome from RNA-seq reads. Nature biotechnology. 33 (3), 290-295 (2015).
  44. Bray, N. L., Pimentel, H., Melsted, P., Pachter, L. Near-optimal probabilistic RNA-seq quantification. Nature Biotechnology. 34 (5), 525-527 (2016).
  45. Patro, R., Duggal, G., Love, M. I., Irizarry, R. A., Kingsford, C. Salmon provides fast and bias-aware quantification of transcript expression. Nature Methods. 14 (4), 417-419 (2017).
  46. Araujo, F. A., Barh, D., Silva, A., Guimarães, L., Thiago, R. . OPEN GO FEAT a rapid web-based functional annotation tool for genomic and transcriptomic data. , 8-11 (2018).
  47. Huerta-Cepas, J., et al. Fast genome-wide functional annotation through orthology assignment by eggNOG-mapper. Molecular Biology and Evolution. 34 (8), 2115-2122 (2017).
  48. Huerta-Cepas, J., et al. EggNOG 5.0: A hierarchical, functionally and phylogenetically annotated orthology resource based on 5090 organisms and 2502 viruses. Nucleic Acids Research. 47, 309-314 (2019).
  49. Törönen, P., Medlar, A., Holm, L. PANNZER2: A rapid functional annotation web server. Nucleic Acids Research. 46, 84-88 (2018).
  50. Robinson, M., Mccarthy, D., Chen, Y., Smyth, G. K. . edgeR differential expression analysis of digital gene expression data User's Guide. , (2013).
  51. Huang, D. W., Sherman, B. T., Lempicki, R. A. Systematic and integrative analysis of large gene lists using DAVID bioinformatics resources. Nature Protocols. 4 (1), 44-57 (2009).
  52. Huang, D. W., Sherman, B. T., Lempicki, R. A. Bioinformatics enrichment tools: Paths toward the comprehensive functional analysis of large gene lists. Nucleic Acids Research. 37 (1), 1-13 (2009).
  53. Letunic, I., Bork, P. Interactive tree of life (iTOL) v3: an online tool for the display and annotation of phylogenetic and other trees. Nucleic acids research. 44, 242-245 (2016).

转载和许可

请求许可使用此 JoVE 文章的文本或图形

请求许可

探索更多文章

171

This article has been published

Video Coming Soon

JoVE Logo

政策

使用条款

隐私

科研

教育

关于 JoVE

版权所属 © 2025 MyJoVE 公司版权所有,本公司不涉及任何医疗业务和医疗服务。