JoVE Logo

登录

需要订阅 JoVE 才能查看此. 登录或开始免费试用。

本文内容

  • 摘要
  • 摘要
  • 引言
  • 研究方案
  • 结果
  • 讨论
  • 披露声明
  • 致谢
  • 材料
  • 参考文献
  • 转载和许可

摘要

该方法描述了提高从正式固定石蜡嵌入(FFPE)RNA样品中获得的序列数据的质量和数量的步骤。我们描述了更准确地评估FFPE-RNA样品质量、准备测序库和分析FFPE-RNA样品数据的方法。

摘要

RNA测序(RNA-seq)的基因表达分析能够对临床样本进行独特的洞察,从而潜在地了解各种疾病的基础以及抗药性和/或易感性机制。然而,FFPE组织是临床标本中保存组织形态的最常见方法,它不是基因表达分析的最佳来源。从这些样本中获得的RNA通常退化、碎片和化学修饰,从而导致测序库不理想。反过来,这些生成质量较差的序列数据,对于基因表达分析和突变发现可能不可靠。为了充分利用FFPE样品,并从低质量样品中获取最佳数据,在规划实验设计、准备测序库和数据分析过程中采取某些预防措施非常重要。这包括使用适当的指标进行精确的样品质量控制 (QC),确定测序库生成期间各种步骤的最佳方法,以及仔细的库 QC。此外,应用正确的软件工具和参数进行序列数据分析对于识别RNA-seq数据中的伪影、过滤污染和低质量读取、评估基因覆盖率的均匀性以及测量生物复制中基因表达特征的可重复性至关重要。这些步骤可确保对非常异构RNA样品进行分析的高精度和可重复性。在这里,我们描述了样品QC,库制备和质量控制,测序和数据分析的各种步骤,可以帮助增加从低质量RNA获得的有用数据的数量,例如从FFPE-RNA组织获得的数据。

引言

使用下一代测序方法使我们能够从各种类型的样品中收集大量信息。但是,对于常用的生成序列数据的方法,旧样本和保存不良的样本仍然不起作用,并且通常需要对成熟的协议进行修改。FFPE组织代表这种样本类型,已广泛用于临床标本11,2,3。2,3虽然FFPE保存维持组织形态,但FFPE组织中的核酸通常表现出广泛的损伤和降解,使得很难检索基因组信息,这些信息可能导致对各种疾病背后的分子机制有重要的见解。

RNA测序产生的基因表达数据通常有助于研究疾病和抗药性机制,并补充DNA突变分析。然而,RNA更容易降解,使得从FFPE组织生成准确的基因表达数据更具挑战性。此外,由于测序的广泛可用性和可负担性是较新的,较老的标本往往没有储存在保持RNA完整性所需的条件下。FFPE样品的一些问题包括:由于嵌入石蜡而导致RNA降解,RNA的化学改性导致测序所需的酶过程的分裂或折射性,以及多A尾部的丢失,限制了寡聚-dT作为反向转录酶的引物的适用性。另一个挑战是在次优条件下处理/储存FFPE样品,这可能导致组织5中的RNA等实验室分子进一步降解。这尤其与在预计对样本进行RNA测序的基因表达分析时可能收集的较老样本特别相关。所有这些都导致提取的RNA的质量和数量下降,可用于生成有用的序列数据。成功概率低,加上测序成本高,使许多研究人员无法尝试从可能有用的FFPE样本中生成和分析基因表达数据。近年来的一些研究表明,FFPE组织在基因表达分析22、6、7、8、96,7,方面的可用性,尽管样本较少和/或较新。8,9

作为可行性研究,我们使用从从监测、流行病学和最终结果(SEER)癌症登记册中提取的FFPE肿瘤组织标本中提取的RNA,用于RNA测序和基因表达分析10。从临床病理实验室采购,来自高级卵巢血清腺癌的FFPE组织在RNA提取前的不同条件下储存7-32年。因为在大多数情况下,这些块储存在不同的地点多年,没有期望将来有任何敏感的基因分析,没有采取任何谨慎保存核酸。因此,大多数样品的RNA质量较差,大部分样品被细菌污染。然而,我们能够执行基因定量,测量基因覆盖的均匀性和连续性,并在生物复制中执行Pearson相关分析,以测量可重复性。基于一组关键特征基因面板,我们将研究中的样本与癌症基因组图谱(TCGA)数据进行了比较,确认约60%的样本具有可比的基因表达特征11。根据各种QC结果和样本元数据之间的相关性,我们确定了关键QC指标,这些指标具有良好的预测价值,可用于识别更有可能生成可用序列数据11的样本。

在这里,我们描述了用于FFPE-RNA质量评估的方法,从提取的RNA样本开始的测序库的生成,以及测序数据的生物信息分析。

研究方案

1. RNA数量和质量评估

  1. 根据预定义的标准选择FFPE样品,并使用适当的方法(例如,FFPE-核酸萃取试剂盒、材料表)提取RNA。
    注:有几种不同的方法可用于FFPE-RNA提取,包括较新的微解剖方法,可以工作很少的组织,并提取高质量的RNA12,13,14。12,13,14
  2. 应尽最大努力在所有阶段保持RNA的完整性。这包括使用无 RNase 脱去水,使用无 RNase 塑料器皿,并使用 RNase 脱污试剂清洁与 FFPE 块接触的所有仪器。
  3. RNA 应始终小心处理并保存在冰中,除非另有说明,以尽量减少处理时的降解。
  4. 如果有足够的材料可用,从FFPE块中的多个区域提取RNA,从尽可能多的样品中产生生物复制。对于一些RNA产量充足的样品,将提取的RNA分成两个,作为技术复制进行加工。
  5. 如果可能,在提取QC(即QC等位)后单独收集少量样品,以避免样品的重复处理和冷冻解冻周期,这可能导致RNA降解。
  6. 根据制造商的说明,在RNA QC系统(例如,使用RNA纳米芯片的安捷伦生物分析仪系统)上运行,检查RNA的质量(最好来自QC等值)
  7. 通过计算DV200和DV100值作为大于 200 nt (DV200)或 100 nt (DV100) 大小的片段的百分比,分析样品中 RNA 片段的分布(例如,使用 Bioanalyzer 2100 专家软件)。
  8. 在 DV200和 DV100中,确定给定样本集的值分布较大的指标,并选取该指标根据样本的完整性程度对样本进行分组。
    注:对于RNA分子更完整的样品组(即DV200值,全部或大部分为DV200 > 40%),DV200可能是一个有用的QC指标。但是,对于成绩单降级较多(即 DV200值较低、全部或大部分具有 DV200 < 40%)的示例集,DV100更可能有用。
  9. 根据 QC 指标,确定具有 DV100 < 40% 的样本。由于这种程度的退化极不可能生成有用的测序数据11,因此最好避免处理此类样本。如果此类样品的替代品可用,则应检查其质量,以理想情况下只包括 DV 100 >50%的样品。

2. 测序库准备

  1. 根据第 1 节中评估的样本质量,确定生成测序库的适当方法。
    1. 对于具有极低降解和高 DV200值的示例集, 使用mRNA测序(即捕获多失性转录本),靶向RNA测序(即,使用捕获探针进行特定感兴趣的基因),RNA外泌测序(即使用捕获探针来丰富编码转录),或总RNA测序(即,使用随机引物反向转录来测序整个RNA种群后从样品中取出核糖核酸酯)。然而,重要的是要注意,固定过程可能会引入偏置在提取的RNA。因此,捕获方法可能并非在所有情况下都工作良好,即使具有高 DV200值也是如此。
    2. 如果样本组包括高降解的样品 (DV200 < 30%),请使用总 RNA 库制备方法,而不是依赖于记录器特定区域捕获的方法,因为降级样本中可能缺少这些特定区域。使用随机引素生成 cDNA 可使可用 RNA 在最终库中具有更高的代表性,因此更适合 FFPE-RNA 样品。
    3. 对于高降解样品组核糖核酸RNA耗竭,使用基于RNaseH的方法。这些方法使rRNA特异性DNA探针与rRNA结合,双链分子被RNaseH消化,剩下的探针由DNase(例如,NEBNext rRNA耗尽试剂盒,材料表)进行清理。与其他方法8相比,这些方法对降级的样本效果更好。
  2. 对于生成测序库,对RNA降解较多的样品(如果可能)使用更高的输入量(如果可能)。100而具有相当优质RNA(DV100 > 60%)的样品即使在较低的输入量下也能产生良好的序列数据(此协议测试的最低值为+20 ng),对于降解性更高的RNA(DV100 < 60%),最好从更高的输入量(例如,>100 ng)开始。
    注: 如果有足够的样品(例如,>500 ng),建议保存至少一半的样品,以便重复库准备(如果需要)。对于低输入样本(例如,<100 ng),通常最好使用整个量并生成足够多样性的库。
  3. 在选择合适的库制备套件,从高降解样品生成总RNA seq库(例如,适用于光明的 NEBNext Ultra II RNA 库准备套件,请参阅材料表),按照制造商的说明生成库。
    注:在库制备过程中,必须跳过降解样品的RNA分片步骤,并确保使用随机底漆进行第一链cDNA合成。
  4. 为了提高效率和速度,特别是对于低输入样品,请使用具有强固定磁铁的适当磁性机架进行基于珠子的纯化和尺寸选择步骤(参见材料表)。
  5. 对于适配器结扎DNA的 PCR 浓缩,根据输入 DNA 的数量调整扩增周期数,以确保最大表示,同时避免不必要的库分子重复。对于低输入的 FFPE-RNA 样品 (<100 ng),我们建议 16-18 个放大周期,而高输入样本 (1,000 ng) 通常在 12-14 轮放大中产生足够的库量。
  6. 根据制造商的说明进行 PCR 扩增和清理后,通过分析适当的平台上的库浓度和分子分布来评估库质量(例如,安捷伦生物分析仪 DNA 芯片,请参阅材料表)。对于底漆峰值 (+80 bp) 或适配器-dimer 峰值 (+128 bp) 的样品,重复清理以移除这些峰值。
  7. 计算每个库的平均库大小(例如,使用 Bioanalyzer 2100 专家软件)。

3. 测序库质量控制

  1. 一旦确定库不含多余的底漆和适配器调子,并且有足够的浓度用于后续测序,则通过 qPCR 进一步定量。
    注:由于群集生成对库集中的敏感性,精确的定量对于防止昂贵的测序运行性能不足或过载至关重要。定量实时 PCR (qPCR) 方法可用于提高 Illumina 平台上的聚类密度,而不会导致过度聚类。qPCR 方法比基于所有库分子(例如安捷伦生物分析仪)的定性和/或定量分析的方法更精确、更敏感,因为它测量的模板两端都有两端的适配器序列,将在流细胞上形成簇。但是,必须提前知道库大小,因为必须对所有样本应用大小校正,以便结果可以与标准曲线进行比较。
    注意:执行 qPCR 时必须始终佩戴实验室外套和手套,并且必须按照制造商的说明在生物安全柜中执行该程序。
    1. 设置一个 96 井板,每个样品有三个复制,使用合适的套件(例如,适用于光明的图书馆的 KAPA SYBR FAST qPCR 主混音、库量化套件的一部分,请参阅材料表),以及标准、正控制(例如,PhiX 控制,请参阅材料表)和无模板控制 (NTC)。NTC 是 qPCR 组合,没有 DNA 库。正控制可以是任何具有已知浓度和片段大小的库。
      1. 根据供应商协议准备至少六个稀释标准。
    2. 添加所有组件(即 qPCR 母料组合、库、标准)后,用密封膜盖住板,并使用刮刀确保薄膜与板均匀且安全接触。
    3. 涡旋,以 1,500 rpm 的速度向下旋转板至少 1 分钟。 目视检查板以确保井底没有气泡。
    4. 使用制造商推荐的设置在热循环器(例如 CFX96 触摸系统,请参阅材料表)上设置板。
    5. 保存运行文件夹,以便访问该文件夹以进行数据分析。
    6. 在数据分析期间,检查斜率是否在 -3.1 到 -3.6 范围内,效率从 90% 到 110%,R2(标准曲线获得的相关系数)是否小于 0.98。
  2. 池:一旦获得测序就绪库的qPCR浓度,根据每个样本所需的测序读取次数和仪器的测序输出,池出每个库的等值量。
  3. 池的 QC:按照步骤 3.1 中所述的相同协议,通过 qPCR 再次对库池进行量化。

4. 排序

  1. 根据运行参数,拉动测序试剂套件,然后按照用户指南将其解冻。请查看 Illumina 网站,了解最新版本的所有用户指南,了解在光明照照仪器上进行测序。
  2. 确保试剂完全解冻,并将试剂托盘置于 4°C。在试剂解冻后,应不迟于 2 小时开始运行。不这样做可能会影响运行结果的质量。
  3. 反转墨盒 5 倍以混合试剂,轻轻敲击工作台以减少气泡。
  4. 将未包装的流动单元包放在室温下 30 分钟。
  5. 用无绒酒精擦拭,解开流动电池包装并清洁流动电池的玻璃表面。用低绒实验室组织擦干玻璃。
  6. 打开光明会"实验管理器"应用程序。选择"创建示例表",然后选择"序列器"并单击"下一步"。
  7. 根据 Illumina 测序仪标准(例如,光明会实验管理器、软件指南)创建和上传示例表。
  8. 在提示符处,扫描试剂套件条形码并输入运行设置参数(例如,对于单个索引 PE 75 周期运行,输入76-8-76)。
  9. 根据音序器用户指南建议对库池进行变性和稀释(例如,来自光明网的 NextSeq 500 系统指南,请参阅材料表)。
  10. 变性和稀释控制库 PhiX(参见材料表) 到适当的浓度(例如,NextSeq 的 1.8 pM)。
  11. 混合样品库和 PhiX 控制,从而产生 1% 的 PhiX 控制容积比。
  12. 将变性和稀释的样品装入指定储液罐中的试剂盒中。
  13. 加载流单元、缓冲盒和试剂盒。
  14. 执行自动检查和检查,以确保运行参数通过系统检查。
  15. 自动检查完成后,选择"开始"以开始排序运行。

5. 数据分析和质量评估

注:典型的RNA-seq数据分析工作流程(图1)包括预处理和质量控制、与基因组和后对齐质量控制对齐、基因和笔录定量、样本相关性分析、不同样本组之间的差分分析、治疗条件以及基因集扩充和通路分析。

RNA-seq数据可能存在质量问题,可能会影响基因分析的准确性,并导致错误的结论。因此,对测序质量、污染、测序覆盖偏差和其他工件来源进行初始质量控制非常重要。建议应用与此处描述的工作流类似的 RNA-Seq QC 管道来检测伪影,并在下游分析之前应用过滤或校正。

  1. 预处理
    注: 这包括消除多用、序列读取质量评估、GC 内容、存在排序适配器、代表过高的k-mers和 PCR 重复读取。此信息有助于检测测序错误、PCR 伪影或污染。
    1. 使用 Illumina 软件工具bcl2fastq2运行 Demultix Illumina 测序,为示例表中定义的每个示例生成原始 FASTQ 文件。如果不存在条形码冲突,则允许样本索引条形码中的一个不匹配,以容忍排序错误。
    2. 运行FASTQC15软件工具,对原始 FASTQ 文件执行质量检查,以检测测序读取的任何不良质量或异常。
    3. 对于适配器和低质量的底座修整,请使用CutADAPT16Trimmatic17软件工具修剪测序适配器和低质量底座。将修剪过的读取保存在对端 fastq 文件中。
    4. 污染屏幕
      1. 运行FASTQ_screen18检测与其他物种的交叉污染。
      2. 运行 Kraken219 的迷你Kraken,以识别污染物种的分类。
  2. 与参考基因组和后对齐 QC 的对齐
    1. 修剪的读取可以使用STAR对齐器20与参考基因组序列(GRCh Build hg19或hg38)对齐。应用 Gencode 注释 GTF 文件以指导拼接的脚本对齐。建议运行 STAR 2 通,以提高对新型拼接结的灵敏度。在第二次传递中,所有读取都将使用批号基因、笔录以及第一次传递的新结重新映射。
    2. 执行对齐后 QC。
      1. 运行 Picard 的21标记重复项,通过确定示例中的唯一或无重复读取量来评估库的复杂性。
      2. 运行 Picard 的收集RnaSeqMetrics计划,收集编码、内电子、互生、UTR 区域和基因体覆盖的映射百分比。
      3. 运行RSeQC22以确定读取对内部距离、CDS 外子、5'UTR、3'UTR、intron、TSS_up_1kb、TSS_up_5kb、TSS_up_10kb、TES_down_1kb、TES_down_5kb、TES_down_10kb、读取 GC 内容、结饱和度和库链信息之间的读取分布。
      4. 运行多 QC23以生成 HTML 格式的聚合报表。
  3. 基因定量和校正分析
    1. 运行RSEM24获得原始计数以及基因和成绩单的标准化读取计数。读取计数测量(如 RPKM(每百万次读取的 exon 模型每千基读取)、FPKM(每百万次映射读取的 exon 模型每千基片段)和 TPM(每百万次记录)是最常报告的 RNA-seq 基因表达值。表示在噪声阈值以下的基因(如 TPM < 1 或原始计数 <5)可以过滤。
    2. 使用 HTSeq 计数或功能计数等程序执行脚本量化,以聚合映射到读取的原始计数到每个脚本序列。
    3. 使用R 脚本运行主要组件分析(PCA), 以确定批处理效果并评估给定数据集25的质量映射。样本相关性分析可以使用不同指标之间的 Pearson 相关性进行。
  4. 差异基因表达分析
    1. 使用程序边缘R26、27,27和/或limma-Voom28在采样条件之间进行基因差分分析,并使用规范化方法,包括 TPM、TMM、DESeq 或上石器TPM TMM DESeq
    2. 建议运行至少两个差分分析软件工具,以便调用两组 DEG 列表进行比较,并获得最终 DEG 以提高检测灵敏度和准确性。
  5. 基因集扩充和通路分析
    1. 根据对不同表达基因(DEGs)列表的测量结果进行基因集扩充分析(GSEA)29、30,以确定DEG是否显示出统计显著性、一致性的生物条件差异。29,30
    2. 使用基因本体31、DAVID DAVID3232、3333或其他可用的软件工具等资源进行功能分析。

结果

上述方法适用于67个FFPE样品,这些样品在各种不同条件下储存了7~32年(样本储存中值为17.5年)。此处介绍的数据集和分析结果此前在赵等11年进行了描述和发布。在检查样品质量时,如前面所述(即图2中的示例痕迹),DV100被认为比 DV200更有用处,因为准确测量高降解 RNA 样品较小片段大小的比例更为敏感。

在给定的?...

讨论

此处描述的方法概述了从 FFPE-RNA 样品获取良好序列数据所需的主要步骤。使用这种方法需要考虑的要点是:(1) 通过最小化样品处理和冷冻和解冻周期,确保提取后尽可能保存RNA。单独的 QC 等号是非常有帮助的。(2) 使用最适合给定样本集的质量控制指标。RIN 值和 DV200通常对降级样本没有用处,DV100可能是评估给定样本集中质量的首选指标。(3) 对于更退化的样品,最好使用...

披露声明

这项工作由国家癌症研究所(NCI)、国家卫生研究院(NIH)资助。莱多斯生物医学研究公司是弗雷德里克国家癌症研究实验室的运营和技术支持承包商,该实验室由NIH全额资助。几位作者(YZ、MM、KT、YL、JS、BT)隶属于莱多斯生物医学研究公司,但所有作者都全部由国家癌症研究所资助,包括作者的工资和研究材料。莱多斯生物医学研究公司没有为作者提供工资(YZ,MM,KT,YL,JS,BT)或研究材料,也没有在研究设计、数据收集、分析、决定出版或编写手稿方面扮演任何角色。

致谢

我们感谢Danielle Carrick博士(国家癌症研究所癌症控制和人口科学司)的持续帮助,特别是为发起这项研究、向我们提供样本以及数据分析过程中的有益建议。我们衷心感谢弗雷德里克国家癌症研究实验室CCR测序基金的所有成员在样品制备和测序方面给予的帮助,特别是布伦达·霍在样品QC、奥克萨纳德语图书馆QC、塔蒂亚娜·斯米尔诺娃(Tatyana Smirnova)操作测序器方面给予的帮助。我们还要感谢测序设施生物信息学集团的沈蔡伟和阿什利·沃尔顿帮助数据分析和RNA-seq管道实施。我们还感谢 CCBR 和 NCBR 在 RNaseq 分析管道和最佳实践开发方面提供的援助。

材料

NameCompanyCatalog NumberComments
2100 BioanalyzerAgilentG2939BA
Agilent DNA 7500 KitAgilent5067-1506
Agilent High Sensitivity DNA KitAgilent5067-4626
Agilent RNA 6000 Nano KitAgilent5067-1511
AllPrep DNA/RNA FFPE KitQiagen80234
CFX96 Touch SystemBio-Rad1855195
Library Quantification kit v2-IlluminaKapaBiosystemsKK4824
NEBNext Ultra II Directional RNA Library Prep Kit for IlluminaNew England BiolabsE7765Shttps://www.neb.com/protocols/2017/02/07/protocol-for-use-with-ffpe-rna-nebnext-rrna-depletion-kit
NEBNext rRNA Depletion Kit (Human/Mouse/Rat)New England BiolabsE6310L
NextSeq 500 Sequencing SystemIlluminaSY-415-1001NextSeq 500 System guide: https://support.illumina.com/content/dam/illumina-support/documents/documentation/system_documentation/nextseq/nextseq-500-system-guide-15046563-06.pdf
NextSeq PhiX Control KitIlluminaFC-110-3002
NSQ 500/550 Hi Output KT v2.5 (150 CYS)Illumina20024907
10X Genomics Magnetic Separator10X Genomics120250
Rotator MultimixerVWR13916-822
C1000 Touch Thermal CyclerBio-Rad1851197
Sequencing reagent kitIllumina20024907
Flow cell packageIllumina20024907
Buffer cartridge and the reagent cartridgeIllumina20024907
Sodium hydroxide solution (0.2N)Millipore SigmaSX0607D-6
TRIS-HCL Buffer 1.0M, pH 7.0Fisher Scientific50-151-871

参考文献

  1. Carrick, D. M., et al. Robustness of Next Generation Sequencing on Older Formalin-Fixed Paraffin-Embedded Tissue. PLoS One. 10 (7), 0127353 (2015).
  2. Hedegaard, J., et al. Next-generation sequencing of RNA and DNA isolated from paired fresh-frozen and formalin-fixed paraffin-embedded samples of human cancer and normal tissue. PLoS One. 9 (5), 98187 (2014).
  3. Zhang, P., Lehmann, B. D., Shyr, Y., Guo, Y. The Utilization of Formalin Fixed-Paraffin-Embedded Specimens in High Throughput Genomic Studies. International Journal of Genomics. 2017, 1926304 (2017).
  4. Srinivasan, M., Sedmak, D., Jewell, S. Effect of fixatives and tissue processing on the content and integrity of nucleic acids. American Journal of Pathology. 161 (6), 1961-1971 (2002).
  5. von Ahlfen, S., Missel, A., Bendrat, K., Schlumpberger, M. Determinants of RNA quality from FFPE samples. PLoS One. 2 (12), 1261 (2007).
  6. Esteve-Codina, A., et al. A Comparison of RNA-Seq Results from Paired Formalin-Fixed Paraffin-Embedded and Fresh-Frozen Glioblastoma Tissue Samples. PLoS One. 12 (1), 0170632 (2017).
  7. Vukmirovic, M., et al. Identification and validation of differentially expressed transcripts by RNA-sequencing of formalin-fixed, paraffin-embedded (FFPE) lung tissue from patients with Idiopathic Pulmonary Fibrosis. BMC Pulmonary Medicine. 17 (1), 15 (2017).
  8. Adiconis, X., et al. Comparative analysis of RNA sequencing methods for degraded or low-input samples. Nature Methods. 10 (7), 623-629 (2013).
  9. Sinicropi, D., et al. Whole transcriptome RNA-Seq analysis of breast cancer recurrence risk using formalin-fixed paraffin-embedded tumor tissue. PLoS One. 7 (7), 40092 (2012).
  10. Altekruse, S. F., et al. SEER cancer registry biospecimen research: yesterday and tomorrow. Cancer Epidemiology, Biomarkers & Prevention. 23 (12), 2681-2687 (2014).
  11. Zhao, Y., et al. Robustness of RNA sequencing on older formalin-fixed paraffin-embedded tissue from high-grade ovarian serous adenocarcinomas. PLoS One. 14 (5), 0216050 (2019).
  12. Amini, P., et al. An optimised protocol for isolation of RNA from small sections of laser-capture microdissected FFPE tissue amenable for next-generation sequencing. BMC Molecular Biology. 18 (1), 22 (2017).
  13. Amini, P., Nassiri, S., Ettlin, J., Malbon, A., Markkanen, E. Next-generation RNA sequencing of FFPE subsections reveals highly conserved stromal reprogramming between canine and human mammary carcinoma. Disease Models and Mechanisms. 12 (8), (2019).
  14. Wimmer, I., et al. Systematic evaluation of RNA quality, microarray data reliability and pathway analysis in fresh, fresh frozen and formalin-fixed paraffin-embedded tissue samples. Scientific Reports. 8 (1), 6351 (2018).
  15. . Babraham Bioinformatics Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ (2019)
  16. Martin, M. Cutadapt removes adapter sequences from high-throughput sequencing reads. EMBnet.journal. 17 (1), 10-12 (2011).
  17. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  18. . Babraham Bioinformatics Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastq_screen/ (2019)
  19. Wood, D. E., Salzberg, S. L. Kraken: ultrafast metagenomic sequence classification using exact alignments. Genome Biology. 15 (3), 46 (2014).
  20. Dobin, A., et al. STAR: ultrafast universal RNA-seq aligner. Bioinformatics. 29 (1), 15-21 (2013).
  21. Wang, L., Wang, S., Li, W. RSeQC: quality control of RNA-seq experiments. Bioinformatics. 28 (16), 2184-2185 (2012).
  22. Ewels, P., Magnusson, M., Lundin, S., Kaller, M. MultiQC: summarize analysis results for multiple tools and samples in a single report. Bioinformatics. 32 (19), 3047-3048 (2016).
  23. Li, B., Dewey, C. N. RSEM: accurate transcript quantification from RNA-Seq data with or without a reference genome. BMC Bioinformatics. 12, 323 (2011).
  24. Son, K., Yu, S., Shin, W., Han, K., Kang, K. A Simple Guideline to Assess the Characteristics of RNA-Seq Data. BioMed Research International. 2018, 2906292 (2018).
  25. McCarthy, D. J., Chen, Y., Smyth, G. K. Differential expression analysis of multifactor RNA-Seq experiments with respect to biological variation. Nucleic Acids Research. 40 (10), 4288-4297 (2012).
  26. Robinson, M. D., McCarthy, D. J., Smyth, G. K. edgeR: a Bioconductor package for differential expression analysis of digital gene expression data. Bioinformatics. 26 (1), 139-140 (2010).
  27. Ritchie, M. E., et al. limma powers differential expression analyses for RNA-sequencing and microarray studies. Nucleic Acids Research. 43 (7), 47 (2015).
  28. Subramanian, A., et al. Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles. Proceedings of the National Academy of Sciences of the United States of America U S A. 102 (43), 15545-15550 (2005).
  29. Mootha, V. K., et al. PGC-1alpha-responsive genes involved in oxidative phosphorylation are coordinately downregulated in human diabetes. Nature Genetics. 34 (3), 267-273 (2003).
  30. Ashburner, M., et al. Gene ontology: tool for the unification of biology. The Gene Ontology Consortium. Nature Genetics. 25 (1), 25-29 (2000).
  31. Huang da, W., Sherman, B. T., Lempicki, R. A. Systematic and integrative analysis of large gene lists using DAVID bioinformatics resources. Nature Protocols. 4 (1), 44-57 (2009).
  32. Huang da, W., Sherman, B. T., Lempicki, R. A. Bioinformatics enrichment tools: paths toward the comprehensive functional analysis of large gene lists. Nucleic Acids Research. 37 (1), 1-13 (2009).
  33. Evaluating RNA Quality from FFPE Samples. Illumina Available from: https://www.illumina.com/content/dam/illumina-marketing/documents/products/technotes/evaluating-rna-quality-from-ffpe-samples-technical-note-470-2014-001.pdf (2016)

转载和许可

请求许可使用此 JoVE 文章的文本或图形

请求许可

探索更多文章

160 RNA FFPE NGS RNA seq

This article has been published

Video Coming Soon

JoVE Logo

政策

使用条款

隐私

科研

教育

关于 JoVE

版权所属 © 2025 MyJoVE 公司版权所有,本公司不涉及任何医疗业务和医疗服务。