JoVE Logo

Anmelden

Zum Anzeigen dieser Inhalte ist ein JoVE-Abonnement erforderlich. Melden Sie sich an oder starten Sie Ihre kostenlose Testversion.

In diesem Artikel

  • Zusammenfassung
  • Zusammenfassung
  • Einleitung
  • Protokoll
  • Ergebnisse
  • Diskussion
  • Offenlegungen
  • Danksagungen
  • Materialien
  • Referenzen
  • Nachdrucke und Genehmigungen

Zusammenfassung

Diese Methode beschreibt die Schritte zur Verbesserung der Qualität und Quantität der Sequenzdaten, die aus formal in-fixierten Paraffin-eingebetteten (FFPE) RNA-Proben gewonnen werden können. Wir beschreiben die Methodik zur genaueren Bewertung der Qualität von FFPE-RNA-Proben, bereiten Sequenzierungsbibliotheken vor und analysieren die Daten aus FFPE-RNA-Proben.

Zusammenfassung

Die Genexpressionsanalyse durch RNA-Sequenzierung (RNA-Seq) ermöglicht einzigartige Einblicke in klinische Proben, die potenziell zu einem mechanistischen Verständnis der Grundlagen verschiedener Krankheiten sowie Resistenz- und/oder Anfälligkeitsmechanismen führen können. FFPE-Gewebe, die die häufigste Methode zur Erhaltung der Gewebemorphologie in klinischen Proben darstellen, sind jedoch nicht die besten Quellen für die Genexpressionsprofilanalyse. Die aus solchen Proben gewonnene RNA wird oft abgebaut, fragmentiert und chemisch modifiziert, was zu suboptimalen Sequenzierungsbibliotheken führt. Diese wiederum erzeugen Sequenzdaten schlechter Qualität, die für die Genexpressionsanalyse und Mutationsermittlung möglicherweise nicht zuverlässig sind. Um das Beste aus FFPE-Proben zu machen und die bestmöglichen Daten aus minderwertigen Proben zu erhalten, ist es wichtig, bestimmte Vorsichtsmaßnahmen zu treffen, während der Planung des experimentellen Entwurfs, der Vorbereitung von Sequenzierungsbibliotheken und bei der Datenanalyse. Dazu gehören die Verwendung geeigneter Metriken für die präzise Stichprobenqualitätskontrolle (QC), die Ermittlung der besten Methoden für verschiedene Schritte während der Generierung der Sequenzierungsbibliothek und die sorgfältige Bibliothek QC. Darüber hinaus ist die Anwendung korrekter Software-Tools und Parameter für die Sequenzdatenanalyse von entscheidender Bedeutung, um Artefakte in RNA-seq-Daten zu identifizieren, Kontaminationen und Lesewerte niedriger Qualität herauszufiltern, die Homogenität der Genabdeckung zu bewerten und die Reproduzierbarkeit von Genexpressionsprofilen zwischen biologischen Replikationen zu messen. Diese Schritte können eine hohe Genauigkeit und Reproduzierbarkeit für die Profilierung sehr heterogener RNA-Proben gewährleisten. Hier beschreiben wir die verschiedenen Schritte für Die Probe QC, Bibliotheksvorbereitung und QC, Sequenzierung und Datenanalyse, die dazu beitragen können, die Menge an nützlichen Daten aus minderwertiger RNA zu erhöhen, wie die aus FFPE-RNA-Geweben.

Einleitung

Die Verwendung von Sequenzierungsansätzen der nächsten Generation hat es uns ermöglicht, eine Fülle von Informationen aus verschiedenen Arten von Stichproben zu erhalten. Alte und schlecht erhaltene Beispiele sind jedoch für die häufig verwendeten Methoden zur Generierung von Sequenzdaten nach wie vor nicht praktikabel und erfordern häufig Änderungen an etablierten Protokollen. FFPE-Gewebe stellen einen solchen Probentyp dar, der für klinische Proben1,2,3weit verbreitet ist. Während die FFPE-Konservierung die Gewebemorphologie aufrechterhält, weisen die Nukleinsäuren in FFPE-Geweben in der Regel eine breite Palette von Schäden und Abbau auf, was es schwierig macht, die genomischen Informationen abzurufen, die zu wichtigen Erkenntnissen über molekulare Mechanismen führen können, die verschiedenen Störungen zugrunde liegen.

Genexpressionsdaten, die durch RNA-Sequenzierung generiert werden, sind oft entscheidend für die Untersuchung von Krankheits- und Resistenzmechanismen und ergänzen die DNA-Mutationsanalyse. Die RNA ist jedoch anfälliger für Degradation, was es schwieriger macht, genaue Genexpressionsdaten aus FFPE-Geweben zu generieren. Da die große Verfügbarkeit und Erschwinglichkeit der Sequenzierung relativ jung ist, wurden ältere Proben oft nicht unter Bedingungen gelagert, die zur Erhaltung der RNA-Integrität erforderlich sind. Einige der Probleme für FFPE-Proben sind der Abbau der RNA durch einbetten in Paraffin, die chemische Modifikation von RNA, die zu Fragmentierung oder Refraktorik zu enzymatischen Prozessen führt, die für die Sequenzierung erforderlich sind, und der Verlust der Poly-A-Schwänze, wodurch die Anwendbarkeit von Oligo-dT als Primer für die Reverse-Transkriptase4begrenzt wird. Eine weitere Herausforderung ist die Handhabung/Lagerung von FFPE-Proben unter suboptimalen Bedingungen, was zu einem weiteren Abbau von labilen Molekülen wie RNA in den Geweben führen kann5. Dies ist besonders relevant für ältere Proben, die zu einer Zeit gesammelt wurden, als eine Genexpressionsanalyse durch RNA-Sequenzierung für die Proben nicht erwartet wurde. All dies führt zu einer verminderten Qualität und Quantität der extrahierten RNA, die für die Generierung nützlicher Sequenzdaten zur Verfügung steht. Die geringe Erfolgswahrscheinlichkeit in Verbindung mit den hohen Kosten der Sequenzierung hat viele Forscher davon abgebracht, Genexpressionsdaten aus potenziell nützlichen FFPE-Proben zu generieren und zu analysieren. Einige Studien in den letzten Jahren haben die Nutzbarkeit von FFPE-Geweben für die Genexpressionsanalyse2,6,7,8,9, wenn auch für weniger und/oder neuere Proben gezeigt.

Als Machbarkeitsstudie verwendeten wir RNA, die aus FFPE-Tumorgewebeproben aus drei Residual Tissue Repositories aus Surveillance, Epidemiology, and End Results (SEER) Krebsregisterfürarbeitung für RNA-Sequenzierung und Genexpressionsanalyse extrahiert wurde10. Die FFPE-Gewebe aus hochgradigen ovarischen serösen Adenokarzinomen wurden von 7 bis 32 Jahren unter unterschiedlichen Bedingungen vor der RNA-Extraktion gelagert. Da diese Blöcke in den meisten Fällen jahrelang an verschiedenen Stellen gelagert worden waren, ohne dass in Zukunft eine sensible genetische Analyse erwartet wurde, wurde nicht viel darauf geachtet, die Nukleinsäuren zu erhalten. So zeigten die meisten Proben eine qualitativ minderwertige RNA, wobei ein großer Teil der Proben mit Bakterien kontaminiert war. Nichtsdestotrotz konnten wir genquantifiziert, die Homogenität und Kontinuität der Genabdeckung messen und die Pearson-Korrelationsanalyse zwischen biologischen Replikationen durchführen, um die Reproduzierbarkeit zu messen. Basierend auf einer Reihe von Schlüssel-Signatur-Gen-Panel, verglichen wir die Proben in unserer Studie mit The Cancer Genome Atlas (TCGA) Daten und bestätigte, dass etwa 60% der Proben hatten vergleichbare Genexpressionsprofile11. Basierend auf der Korrelation zwischen verschiedenen QC-Ergebnissen und Beispielmetadaten identifizierten wir wichtige QC-Metriken, die einen guten Vorhersagewert für die Identifizierung von Stichproben haben, die eher verwendbare Sequenzdaten generieren11.

Hier beschreiben wir die Methodik für die FFPE-RNA-Qualitätsbewertung, die Generierung von Sequenzierungsbibliotheken ausgehend von extrahierten RNA-Proben und die bioinformatische Analyse der Sequenzierungsdaten.

Protokoll

1. RNA-Quantitäts- und Qualitätsbewertung

  1. Wählen Sie die FFPE-Proben nach vordefinierten Kriterien aus und extrahieren Sie RNA nach einer geeigneten Methode (z.B. FFPE-Kernsäureextraktionskit, Tabelle der Materialien).
    HINWEIS: Es gibt verschiedene Methoden für die FFPE-RNA-Extraktion, einschließlich der neueren Mikrodissektionsmethoden, die mit sehr wenig Gewebe arbeiten und gute RNA12,,13,,14extrahieren können.
  2. Es sollte äußerst darauf geachtet werden, die Integrität der RNA in allen Stadien zu erhalten. Dazu gehört die Arbeit mit RNase-freiem entionisiertem Wasser, die Verwendung von RNase-freiem Kunststoff und die Reinigung aller Instrumente, die mit den FFPE-Blöcken mit RNase-Dekontaminationsreagenzien in Berührung kommen.
  3. RNA sollte immer sorgfältig behandelt und im Eis aufbewahrt werden, sofern nicht anders angegeben, um den Abbau während der Handhabung zu minimieren.
  4. Wenn genügend Material zur Verfügung steht, extrahieren Sie RNA aus mehr als einer Region im FFPE-Block, um biologische Replikationen aus so vielen Proben wie möglich zu erzeugen. Teilen Sie für einige der Proben mit ausreichender RNA-Ausbeute die extrahierte RNA in zwei teile, um sie als technische Replikationen zu verarbeiten.
  5. Wenn möglich, sammeln Sie eine kleine Menge der Probe separat nach der Extraktion für QC (d. h. ein QC aliquot), um wiederholte Handhabung und Frost-Tau-Zyklen der Probe zu vermeiden, die wahrscheinlich zum Abbau der RNA führen.
  6. Überprüfen Sie die Qualität der RNA (vorzugsweise aus dem QC aliquot), indem Sie sie auf einem RNA-QC-System (z.B. Agilent Bioanalyzer-System mit einem RNA Nano Chip, Table of Materials)gemäß den Anweisungen des Herstellers ausführen.
  7. Analysieren Sie die Verteilung von RNA-Fragmenten in den Proben (z.B. mit der Software Bioanalyzer 2100 Expert), indem Sie die DV200- und DV100-Werte als Prozentsatz der Fragmente mit einer Größe von mehr als 200 nt (DV200) oder 100 nt (DV100) berechnen.
  8. Identifizieren Sie unter DV200 und DV100die Metrik mit einer größeren Streuung von Werten für den angegebenen Stichprobensatz, und wählen Sie diese für die Gruppierung der Stichproben nach ihrem Intaktgrad aus.
    HINWEIS: Bei Probensätzen mit intakteren RNA-Molekülen (d. h. hohen DV200-Werten, alle oder die meisten mit DV200 > 40%) ist DV200 wahrscheinlich eine nützliche QC-Metrik. Bei Sample-Sets mit mehr degradierten Transkripten (d. h. niedrigen DV200-Werten, alle oder die meisten mit DV200 < 40%) ist JEDOCH DV100 eher nützlich.
  9. Identifizieren Sie anhand der QC-Metriken die Samples mit DV100 < 40%. Da dieser Grad der Verschlechterung mit hoher Wahrscheinlichkeit keine nützlichen Sequenzierungsdaten11erzeugt, ist es ratsam, die Verarbeitung solcher Proben zu vermeiden. Wenn Ersatz für solche Proben verfügbar ist, sollte ihre Qualität überprüft werden, um idealerweise nur Proben mit DV100 > 50% einzubeziehen.

2. Vorbereitung der Sequenzierungsbibliothek

  1. Ermitteln Sie anhand der Qualität der in Abschnitt 1 bewerteten Stichproben eine geeignete Methode zum Generieren der Sequenzierungsbibliotheken.
    1. Für Probensätze mit sehr geringem Abbau und hohen DV200-Werten verwenden Sie die mRNA-Sequenzierung (d. h. Erfassung polyadenylierter Transkripte), gezielte RNA-Sequenzierung (d. h. Verwendung von Capture-Sonden für bestimmte Gene von Interesse), RNA-Exome-Sequenzierung (d. h. Verwendung von Capture-Sonden zur Anreicherung für das kodierungstranskriptom) oder gesamter RNA-Sequenzierung (d. h. Verwendung von Zufallsprimern zur umgekehrten Transkription zur Sequenzierung der gesamten RNA-Population nach Entfernung der Rippen). Es ist jedoch wichtig zu beachten, dass der Fixierungsprozess Zuneigung in der extrahierten RNA einführen kann. Somit funktionieren die Erfassungsansätze möglicherweise nicht in allen Fällen, selbst bei hohen DV200-Werten.
    2. Wenn der Stichprobensatz Proben mit hohem Abbau enthält (DV200 < 30%), verwenden Sie eine Methode zur Vorbereitung der RNA-Bibliothek insgesamt und nicht eine Methode, die von der Erfassung bestimmter Regionen der Transkripte abhängt, da diese spezifischen Regionen in degradierten Proben möglicherweise fehlen. Die Verwendung von Zufallsprimern zur CDNA-Generierung führt zu einer höheren Darstellung nutzbarer RNA in der endgültigen Bibliothek und ist daher besser für FFPE-RNA-Proben geeignet.
    3. Verwenden Sie für ribosomale RNA-Erschöpfung für Probensätze mit hohem Abbau RNaseH-basierte Methoden. Dies sind Methoden, bei denen rRNA-spezifische DNA-Sonden an rRNA binden, doppelsträngige Moleküle von RNaseH verdaut werden und übrig gebliebene Sonden von DNase gereinigt werden (z.B. NEBNext rRNA Erschöpfungskit, Tabelle der Materialien). Diese Methoden funktionieren bei degradierten Proben besser als bei einigen anderen Methoden8.
  2. Verwenden Sie für die Generierung von Sequenzierungsbibliotheken (wenn möglich) höhere Eingangsmengen für Proben, die eine stärker degradierte RNA haben (DV100 < 60%). Während Proben mit relativ guter RNA-Qualität (DV100 > 60%) kann auch bei niedrigeren Eingangsmengen gute Sequenzdaten liefern (die niedrigste für dieses Protokoll mit FFPE-RNA getestet wurde, war 20 ng), für mehr degradierte RNA (DV100 < 60%), ist es besser, mit höheren Eingangsmengen zu beginnen (z. B. >100 ng).
    HINWEIS: Wenn genügend (z. B. >500 ng) Beispiel zur Verfügung steht, ist es ratsam, mindestens die Hälfte des Samples zu speichern, um die Bibliotheksvorbereitung bei Bedarf zu wiederholen. Bei Proben mit geringer Eingabe (z. B. <100 ng) ist es in der Regel besser, den gesamten Betrag zu verwenden und eine Bibliothek mit ausreichender Vielfalt zu generieren.
  3. Nach der Auswahl eines geeigneten Bibliotheksvorbereitungskits zur Generierung von RNA-Seq-Bibliotheken insgesamt aus Proben mit hohem Abbau (z. B. NEBNext Ultra II RNA Library Prep Kit für Illumina, siehe Tabelle der Materialien),folgen Sie den Anweisungen des Herstellers, um die Bibliotheken zu generieren.
    HINWEIS: Bei der Bibliotheksvorbereitung ist es wichtig, den RNA-Fragmentierungsschritt für degradierte Proben zu überspringen und die Verwendung von zufälligen Primern für die cDNA-Synthese des ersten Strangs sicherzustellen.
  4. Zur Verbesserung der Effizienz und Geschwindigkeit, insbesondere für die Proben mit niedrigem Eingang, verwenden Sie geeignete Magnetträger mit starken festen Magneten für perlenbasierte Reinigungs- und Größenauswahlschritte (siehe Materialtabelle).
  5. Passen Sie für die PCR-Anreicherung der adaptergebundenen DNA die Anzahl der Amplifikationszyklen basierend auf der Menge der Eingangs-DNA an, um eine maximale Darstellung zu gewährleisten und unnötige Duplizierungen der Bibliotheksmoleküle zu vermeiden. Für FFPE-RNA-Proben mit niedrigem Eingang (<100 ng) empfehlen wir 16–18 Amplifikationszyklen, während die hohen Eingangsproben (1.000 ng) in der Regel genügend Bibliotheksmengen in 12–14 Amplifikationsrunden generieren.
  6. Bewerten Sie nach der PCR-Verstärkung und -Bereinigung gemäß den Anweisungen des Herstellers die Bibliotheksqualität, indem Sie die Bibliothekskonzentration und Molekülverteilung auf einer geeigneten Plattform analysieren (z. B. Agilent Bioanalyzer DNA Chip, siehe Tabelle der Materialien). Wiederholen Sie bei Samples mit Primer-Peaks (ca. 80 bp) oder Adapter-Dimer-Peaks (ca. 128 bp) die Bereinigung, um diese Spitzen zu entfernen.
  7. Berechnen Sie die durchschnittliche Bibliotheksgröße für jede Bibliothek (z. B. mit der Software Bioanalyzer 2100 Expert).

3. Sequenzierungsbibliothek QC

  1. Sobald festgestellt wurde, dass die Bibliotheken frei von überschüssigen Primer und Adapter-Dimern sind und eine ausreichende Konzentration für die nachfolgende Sequenzierung haben, wird durch qPCR weiter quantitiert.
    HINWEIS: Aufgrund der Empfindlichkeit der Clustergenerierung gegenüber der Bibliothekskonzentration ist eine genaue Quantifizierung von entscheidender Bedeutung, um zu verhindern, dass kostspielige Sequenzierungsläufe unterLeistung oder Überlastung geraten. Quantitative Echtzeit-PCR-Methoden (qPCR) sind nützlich, um die Clusterdichte auf Illumina-Plattformen zu verbessern, ohne dass es zu einer Überclusterbildung führt. Die qPCR-Methode ist präziser und empfindlicher als die Methoden, die auf der qualitativen und/oder quantitativen Analyse aller Bibliotheksmoleküle (z. B. Agilent Bioanalyzer) basieren, da sie die Vorlagen misst, die beide Adaptersequenzen an beiden Enden haben, die Cluster auf der Flowcell bilden. Die Bibliotheksgröße muss jedoch im Voraus bekannt sein, da eine Größenkorrektur auf alle Stichproben angewendet werden muss, damit die Ergebnisse mit einer Standardkurve verglichen werden können.
    VORSICHT: Labormäntel und Handschuhe müssen immer bei der Durchführung von qPCR getragen werden, und das Verfahren muss in einem Biosicherheitsschrank gemäß den Anweisungen des Herstellers durchgeführt werden.
    1. Richten Sie eine 96-Well-Platte mit drei Replikationen für jede Probe zur Fehlervermeidung ein, indem Sie ein geeignetes Kit verwenden (z. B. KAPA SYBR FAST qPCR Master Mix für Illumina-Bibliotheken, einen Teil des Library Quantification Kits, siehe Tabelle der Materialien), zusammen mit den Standards, einer positiven Steuerung (z. B. PhiX-Steuerung, siehe Tabelle der Materialien)und einem No Template Control (NTC). Der NTC ist qPCR-Mix ohne DNA-Bibliothek. Die positive Kontrolle kann jede Bibliothek mit bekannter Konzentration und Fragmentgröße sein.
      1. Bereiten Sie mindestens sechs Verdünnungen der Standards gemäß dem Herstellerprotokoll vor.
    2. Nach Dem Hinzufügen aller Komponenten (z.B. qPCR-Master-Mix, Bibliotheken, Standards), decken Sie die Platte mit Dichtungsfolie ab und verwenden Sie einen Rakel, um sicherzustellen, dass die Folie einen gleichmäßigen und sicheren Kontakt mit der Platte herstellt.
    3. Wirbel und drehen Sie die Platte bei 1.500 U/min für mindestens 1 min. Überprüfen Sie die Platte visuell, um sicherzustellen, dass es keine Luftblasen an der Unterseite der Brunnen.
    4. Richten Sie die Platte auf dem Thermocycler (z. B. CFX96 Touch System, siehe Materialtabelle) unter Verwendung der vom Hersteller empfohlenen Einstellungen ein.
    5. Speichern Sie den Ausführungsordner, in dem auf ihn für die Datenanalyse zugegriffen werden kann.
    6. Überprüfen Sie bei der Datenanalyse, ob sich die Steigung im Bereich -3,1 bis -3,6, der Wirkungsgrad von 90 % bis 110 % und derR2 (Korrelationskoeffizient für die Standardkurve) nicht weniger als 0,98 befindet.
  2. Pooling: Sobald die qPCR-Konzentration der Sequenzierungs-Ready-Bibliotheken erhalten ist, werden die Äquimolarenbeträge der einzelnen Bibliotheken in Pool-Äquimolar-Mengen, abhängig von der Anzahl der Sequenzierungslesevorgänge, die pro Probe erforderlich sind, und der Sequenzierungsausgabe des Instruments abgerufen.
  3. QC der Pools: Quantitieren Sie die Bibliothekspools erneut durch qPCR nach dem gleichen Protokoll wie in Schritt 3.1 beschrieben.

4. Sequenzierung

  1. Ziehen Sie die Sequenzierungsreagenz-Kits je nach Ausführungsparametern und tauen Sie sie im Benutzerhandbuch auf. Auf der Illumina-Website finden Sie die neuesten Versionen aller Benutzerhandbücher für die Sequenzierung auf Illumina-Instrumenten.
  2. Stellen Sie sicher, dass die Reagenzien vollständig aufgetaut sind, und legen Sie die Reagenzienschale auf 4 °C. Der Lauf sollte spätestens 2 h nach dem Auftauen der Reagenzien gestartet werden. Wenn dies nicht der Fall ist, kann sich dies auf die Qualität der Laufergebnisse auswirken.
  3. Invertieren Sie die Patrone 5x, um Reagenzien zu mischen und tippen Sie vorsichtig auf die Bank, um Luftblasen zu reduzieren.
  4. Stellen Sie das unverpackte Flow-Zell-Paket bei Raumtemperatur für 30 min beiseite.
  5. Entpacken Sie das Flow-Zell-Paket und reinigen Sie die Glasoberfläche der Durchflusszelle mit einem fusselfreien Alkoholwisch. Trocknen Sie das Glas mit einem low-lint Laborgewebe.
  6. Öffnen Sie die Illumina -Anwendung "Experiment Manager". Wählen Sie "Sample Sheet erstellen", dann wählen Sie den Sequencer und klicken Sie auf"Weiter".
  7. Erstellen und hochladen Sie das Beispielblatt basierend auf den Illumina-Sequenzerkriterien (z. B. Illumina Experiment Manager, Softwareguide).
  8. Scannen Sie an den Eingabeaufforderungen den Reagenzien-Kit-Barcode und geben Sie den Run Set Up Parameters ein (z. B. für einen einzelnen indizierten PE 75-Zykluslauf, geben Sie 76-8-76ein).
  9. Denaturieren und verdünnen Sie den Bibliothekspool basierend auf der Sequencer-Benutzerhandbuch-Empfehlung (z. B. NextSeq 500 Systemguide von Illumina, siehe Tabelle der Materialien).
  10. Denaturieren und verdünnen Sie die Kontrollbibliothek PhiX (siehe Materialtabelle) auf die entsprechende Konzentration (z. B. 1,8 pM für NextSeq).
  11. Mischen Sie Die Beispielbibliothek und die PhiX-Steuerung, um ein Verhältnis von 1% PhiX-Steuervolumen zu erzielen.
  12. Belasten Sie denaturierte und verdünnte Probe in die Reagenzpatrone im dafür vorgesehenen Reservoir.
  13. Laden Sie die Flowcell, die Pufferkassette und die Reagenzkassette.
  14. Führen Sie eine automatisierte Überprüfung durch, um sicherzustellen, dass die Ausführungsparameter die Systemprüfung bestehen.
  15. Wenn die automatisierte Prüfung abgeschlossen ist, wählen Sie Start aus, um mit der Sequenzierung zu beginnen.

5. Datenanalyse und Qualitätsbewertung

ANMERKUNG: Ein typischer RNA-Seq-Datenanalyse-Workflow (Abbildung 1) umfasst Vorverarbeitung und QC, Ausrichtung auf Genom und Post-Alignment QC, Gen- und Transkriptquantifizierung, Probenkorrelationsanalyse, Differentialanalyse zwischen verschiedenen Probengruppen, Behandlungsbedingungen sowie Gensatzanreicherung und Pfadanalyse.

Die RNA-Seq-Daten können Qualitätsprobleme haben, die die Genauigkeit des Genprofilings beeinflussen und zu falschen Schlussfolgerungen führen können. Daher sind anfängliche QC-Prüfungen auf Sequenzierungsqualität, Kontamination, Sequenzierungsabdeckungsverzerrung und andere Quellen von Artefakten sehr wichtig. Das Anwenden einer RNA-Seq QC-Pipeline ähnlich dem hier beschriebenen Workflow wird empfohlen, um Artefakte zu erkennen und Filterung oder Korrektur vor der nachgelagerten Analyse anzuwenden.

  1. Vorverarbeitung
    HINWEIS: Dazu gehören Demultiplexing, Bewertung der Sequenzlesequalität, GC-Inhalt, Vorhandensein von Sequenzierungsadaptern, überrepräsentierte k-mersund PCR duplizierte Lesevorgänge. Diese Informationen helfen, Sequenzierungsfehler, PCR-Artefakte oder Kontaminationen zu erkennen.
    1. Demultiplex Illumina-Sequenzierung wird mit dem Illumina-Softwaretool bcl2fastq2 ausgeführt, um unformatierte FASTQ-Dateien für jedes im Beispielblatt definierte Beispiel zu generieren. Erlauben Sie einer Nichtübereinstimmung in den Beispielindex-Barcodes, sequenziierende Sequenzierungsfehler zu tolerieren, wenn es keine Barcodekollision gibt.
    2. Führen Sie das Softwaretool FASTQC15 aus, um eine Qualitätsprüfung für unformatierte FASTQ-Dateien durchzuführen, um schlechte Qualität oder Anomalien bei der Sequenzierung von Lesevorgängen zu erkennen.
    3. Für Adapter und minderwertige Basen Trimmen, trimmen Sie die Sequenzierungsadapter und minderwertige Basen mit Cutadapt16 oder Trimmomatic17 Software-Tools. Speichern Sie die getrimmten Lesevorgänge in den Paar-Ende-Fastq-Dateien.
    4. Kontaminationsbildschirm
      1. Führen Sie FASTQ_screen18 aus, um eine mögliche Kreuzkontamination mit anderen Arten zu erkennen.
      2. Führen Sie miniKraken von Kraken219 aus, um die Taxonomien kontaminierender Arten zu identifizieren.
  2. Ausrichtung auf Referenzgenom und Post-Alignment QC
    1. Die getrimmten Lesevorgänge können mit STAR aligner20an einer Referenzgenomsequenz (GRCh Build hg19 oder hg38) ausgerichtet werden. Wenden Sie die Gencode-Annotation-GTF-Datei an, um die gespleißte Transkriptausrichtung zu steuern. Es wird empfohlen, STAR 2-Pass zu betreiben, um die Empfindlichkeit gegenüber neuartigen Spleißknoten zu erhöhen. Im zweiten Durchgang werden alle Lesevorgänge mit annotierten Genen und Transkripten und neuartigen Kreuzungen aus dem ersten Durchgang neu zugeordnet.
    2. Führen Sie EIN QC nach der Ausrichtung aus.
      1. Führen Sie die21MarkDuplicates von Picard aus, um die Bibliothekskomplexität zu bewerten, indem Sie die Menge an eindeutigen oder nicht duplizierten Lesevorgängen in den Beispielen ermitteln.
      2. Führen Sie das CollectRnaSeqMetrics-Programm von Picard aus, um Mapping-Prozentsätze für Codierung, Intronic, Intergene, UTR-Regionen und Genkörperabdeckung zu sammeln.
      3. Führen Sie RSeQC22 aus, um die innere Entfernung des Lesepaars, die Leseverteilung zwischen CDS-Exons, 5'UTR, 3'UTR, intron, TSS_up_1kb, TSS_up_5kb, TSS_up_10kb, TES_down_1kb, TES_down_5kb, TES_down_10kb, LESEN von GC-Inhalten, Knotensättigung und Bibliotheksstranginformationen zu ermitteln.
      4. Führen Sie multi-QC23 aus, um einen aggregierten Bericht im HTML-Format zu generieren.
  3. Genquantifizierungs- und Korrekturanalyse
    1. Führen Sie RSEM24 aus, um Rohzählung sowie normalisierte Lesezählung auf Gene und Transkripte zu erhalten. Die Lesezählmessung wie RPKM (Liest pro Kilobase von Exonmodell pro Million Lesevorgänge), FPKM (Fragmente pro Kilobase des Exonmodells pro Million zugeordneter Lesevorgänge) und TPM (Transkripte pro Million) sind die am häufigsten gemeldeten RNA-Seq-Genexpressionswerte. Gene, die unterhalb eines Rauschenschwellenwerts ausgedrückt werden (z. B. TPM < 1 oder Rohanzahl <5), können gefiltert werden.
    2. Führen Sie die Transkriptquantifizierung durch, um die Rohanzahl der zugeordneten Lesevorgänge mit Programmen wie HTSeq-Count oder FeatureCounts zu aggregieren.
    3. Führen Sie Principal Components Analysis (PCA) mithilfe eines R-Skripts aus, um Batcheffekte zu ermitteln und eine Qualitätszuordnung des angegebenenDatasets 25zu bewerten. Die Stichprobenkorrelationsanalyse kann mit der Pearson-Korrelation zwischen verschiedenen Metriken durchgeführt werden.
  4. Differentialgenexpressionsanalyse
    1. Führen Sie eine Gendifferenzanalyse zwischen den Probenbedingungen mit dem Programm edgeR26,27 und/oder limma-Voom28 durch und verwenden Sie Normalisierungsmethoden wie TPM, TMM, DESeqoder UpperQuartile.
    2. Es wird empfohlen, mindestens zwei Softwaretools für die Differenzanalyse auszuführen, um zwei DEGs-Listen zum Vergleich aufzurufen und die endgültigen DEGs zu erhalten, um die Erkennungsempfindlichkeit und -genauigkeit zu verbessern.
  5. Genset-Anreicherung und Signalweganalyse
    1. Führen Sie Gene Set Enrichment Analysis (GSEA)29,30 basierend auf der Rangfolge von Transkripten nach einer Messung der Differential-Expressed-Gene (DEGs) Liste durch, um festzustellen, ob die DEGs statistisch signifikante, konkordante Unterschiede zwischen biologischen Bedingungen aufweisen.
    2. Führen Sie Funktionsanalysen mit Ressourcen wie Gene Ontology31, DAVID32,33oder anderen verfügbaren Softwaretools durch.

Ergebnisse

Die oben beschriebene Methode wurde auf 67 FFPE-Proben angewendet, die 7–32 Jahre lang unter verschiedenen Bedingungen gelagert worden waren (die mediane Probenlagerzeit betrug 17,5 Jahre). Die hier vorgestellten Datenundanalyseergebnisse wurden zuvor in Zhao et al.11beschrieben und veröffentlicht. Bei der Überprüfung der Probenqualität, wie sie zuvor beschrieben wurde (d. h. Beispielspuren in Abbildung 2), erwies sich DV100 als nützlicher als DV

Diskussion

Die hier beschriebene Methode beschreibt die wichtigsten Schritte, die erforderlich sind, um gute Sequenzdaten aus FFPE-RNA-Proben zu erhalten. Die wichtigsten Punkte, die bei dieser Methode zu berücksichtigen sind: (1) Stellen Sie sicher, dass die RNA nach der Extraktion so gut wie möglich erhalten bleibt, indem Sie die Probenhandhabung und die Gefrier- und Auftauzyklen minimieren. Separate QC-Aliquots sind sehr hilfreich. (2) Verwenden Sie eine QC-Metrik, die für den angegebenen Stichprobensatz am besten geeignet is...

Offenlegungen

Diese Arbeit wurde vom National Cancer Institute (NCI), National Institutes of Health (NIH) finanziert. Leidos Biomedical Research, Inc. ist der operative und technische Support-Auftragnehmer für das Frederick National Laboratory for Cancer Research, das vollständig von NIH finanziert wird. Mehrere Autoren (YZ, MM, KT, YL, JS, BT) sind mit Leidos Biomedical Research, Inc. verbunden, aber alle Autoren werden vollständig vom National Cancer Institute finanziert, einschließlich der Gehälter der Autoren und Forschungsmaterialien. Leidos Biomedical Research, Inc. stellte weder Gehalt für die Autoren (YZ, MM, KT, YL, JS, BT) noch Material für die Studie zur Verfügung, noch hatte es eine Rolle bei der Erstellung, Datenerhebung, Analyse, Entscheidung zur Veröffentlichung oder Vorbereitung des Manuskripts.

Danksagungen

Wir danken Dr. Danielle Carrick (Abteilung für Krebsbekämpfung und Bevölkerungswissenschaften, National Cancer Institute) für die weitere Hilfe, insbesondere für die Einleitung dieser Studie, die Bereitstellung der Proben und für hilfreiche Vorschläge bei der Datenanalyse. Wir danken allen Mitgliedern der CCR-Sequenzierungsanlage am Frederick National Laboratory for Cancer Research für ihre Hilfe bei der Probenvorbereitung und -sequenzierung, insbesondere Brenda Ho für die Unterstützung in der Probe QC, Oksana German für die Bibliothek QC, Tatyana Smirnova für die Durchführung der Sequenzer. Wir danken auch Tsai-wei Shen und Ashley Walton von der Sequencing Facility Bioinformatics Group für ihre Unterstützung bei der Datenanalyse und der Implementierung von RNA-seq-Pipelines. Wir danken auch CCBR und NCBR für die Unterstützung bei der RNaseq-Analysepipeline und der Entwicklung von Best Practices.

Materialien

NameCompanyCatalog NumberComments
2100 BioanalyzerAgilentG2939BA
Agilent DNA 7500 KitAgilent5067-1506
Agilent High Sensitivity DNA KitAgilent5067-4626
Agilent RNA 6000 Nano KitAgilent5067-1511
AllPrep DNA/RNA FFPE KitQiagen80234
CFX96 Touch SystemBio-Rad1855195
Library Quantification kit v2-IlluminaKapaBiosystemsKK4824
NEBNext Ultra II Directional RNA Library Prep Kit for IlluminaNew England BiolabsE7765Shttps://www.neb.com/protocols/2017/02/07/protocol-for-use-with-ffpe-rna-nebnext-rrna-depletion-kit
NEBNext rRNA Depletion Kit (Human/Mouse/Rat)New England BiolabsE6310L
NextSeq 500 Sequencing SystemIlluminaSY-415-1001NextSeq 500 System guide: https://support.illumina.com/content/dam/illumina-support/documents/documentation/system_documentation/nextseq/nextseq-500-system-guide-15046563-06.pdf
NextSeq PhiX Control KitIlluminaFC-110-3002
NSQ 500/550 Hi Output KT v2.5 (150 CYS)Illumina20024907
10X Genomics Magnetic Separator10X Genomics120250
Rotator MultimixerVWR13916-822
C1000 Touch Thermal CyclerBio-Rad1851197
Sequencing reagent kitIllumina20024907
Flow cell packageIllumina20024907
Buffer cartridge and the reagent cartridgeIllumina20024907
Sodium hydroxide solution (0.2N)Millipore SigmaSX0607D-6
TRIS-HCL Buffer 1.0M, pH 7.0Fisher Scientific50-151-871

Referenzen

  1. Carrick, D. M., et al. Robustness of Next Generation Sequencing on Older Formalin-Fixed Paraffin-Embedded Tissue. PLoS One. 10 (7), 0127353 (2015).
  2. Hedegaard, J., et al. Next-generation sequencing of RNA and DNA isolated from paired fresh-frozen and formalin-fixed paraffin-embedded samples of human cancer and normal tissue. PLoS One. 9 (5), 98187 (2014).
  3. Zhang, P., Lehmann, B. D., Shyr, Y., Guo, Y. The Utilization of Formalin Fixed-Paraffin-Embedded Specimens in High Throughput Genomic Studies. International Journal of Genomics. 2017, 1926304 (2017).
  4. Srinivasan, M., Sedmak, D., Jewell, S. Effect of fixatives and tissue processing on the content and integrity of nucleic acids. American Journal of Pathology. 161 (6), 1961-1971 (2002).
  5. von Ahlfen, S., Missel, A., Bendrat, K., Schlumpberger, M. Determinants of RNA quality from FFPE samples. PLoS One. 2 (12), 1261 (2007).
  6. Esteve-Codina, A., et al. A Comparison of RNA-Seq Results from Paired Formalin-Fixed Paraffin-Embedded and Fresh-Frozen Glioblastoma Tissue Samples. PLoS One. 12 (1), 0170632 (2017).
  7. Vukmirovic, M., et al. Identification and validation of differentially expressed transcripts by RNA-sequencing of formalin-fixed, paraffin-embedded (FFPE) lung tissue from patients with Idiopathic Pulmonary Fibrosis. BMC Pulmonary Medicine. 17 (1), 15 (2017).
  8. Adiconis, X., et al. Comparative analysis of RNA sequencing methods for degraded or low-input samples. Nature Methods. 10 (7), 623-629 (2013).
  9. Sinicropi, D., et al. Whole transcriptome RNA-Seq analysis of breast cancer recurrence risk using formalin-fixed paraffin-embedded tumor tissue. PLoS One. 7 (7), 40092 (2012).
  10. Altekruse, S. F., et al. SEER cancer registry biospecimen research: yesterday and tomorrow. Cancer Epidemiology, Biomarkers & Prevention. 23 (12), 2681-2687 (2014).
  11. Zhao, Y., et al. Robustness of RNA sequencing on older formalin-fixed paraffin-embedded tissue from high-grade ovarian serous adenocarcinomas. PLoS One. 14 (5), 0216050 (2019).
  12. Amini, P., et al. An optimised protocol for isolation of RNA from small sections of laser-capture microdissected FFPE tissue amenable for next-generation sequencing. BMC Molecular Biology. 18 (1), 22 (2017).
  13. Amini, P., Nassiri, S., Ettlin, J., Malbon, A., Markkanen, E. Next-generation RNA sequencing of FFPE subsections reveals highly conserved stromal reprogramming between canine and human mammary carcinoma. Disease Models and Mechanisms. 12 (8), (2019).
  14. Wimmer, I., et al. Systematic evaluation of RNA quality, microarray data reliability and pathway analysis in fresh, fresh frozen and formalin-fixed paraffin-embedded tissue samples. Scientific Reports. 8 (1), 6351 (2018).
  15. . Babraham Bioinformatics Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ (2019)
  16. Martin, M. Cutadapt removes adapter sequences from high-throughput sequencing reads. EMBnet.journal. 17 (1), 10-12 (2011).
  17. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  18. . Babraham Bioinformatics Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastq_screen/ (2019)
  19. Wood, D. E., Salzberg, S. L. Kraken: ultrafast metagenomic sequence classification using exact alignments. Genome Biology. 15 (3), 46 (2014).
  20. Dobin, A., et al. STAR: ultrafast universal RNA-seq aligner. Bioinformatics. 29 (1), 15-21 (2013).
  21. Wang, L., Wang, S., Li, W. RSeQC: quality control of RNA-seq experiments. Bioinformatics. 28 (16), 2184-2185 (2012).
  22. Ewels, P., Magnusson, M., Lundin, S., Kaller, M. MultiQC: summarize analysis results for multiple tools and samples in a single report. Bioinformatics. 32 (19), 3047-3048 (2016).
  23. Li, B., Dewey, C. N. RSEM: accurate transcript quantification from RNA-Seq data with or without a reference genome. BMC Bioinformatics. 12, 323 (2011).
  24. Son, K., Yu, S., Shin, W., Han, K., Kang, K. A Simple Guideline to Assess the Characteristics of RNA-Seq Data. BioMed Research International. 2018, 2906292 (2018).
  25. McCarthy, D. J., Chen, Y., Smyth, G. K. Differential expression analysis of multifactor RNA-Seq experiments with respect to biological variation. Nucleic Acids Research. 40 (10), 4288-4297 (2012).
  26. Robinson, M. D., McCarthy, D. J., Smyth, G. K. edgeR: a Bioconductor package for differential expression analysis of digital gene expression data. Bioinformatics. 26 (1), 139-140 (2010).
  27. Ritchie, M. E., et al. limma powers differential expression analyses for RNA-sequencing and microarray studies. Nucleic Acids Research. 43 (7), 47 (2015).
  28. Subramanian, A., et al. Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles. Proceedings of the National Academy of Sciences of the United States of America U S A. 102 (43), 15545-15550 (2005).
  29. Mootha, V. K., et al. PGC-1alpha-responsive genes involved in oxidative phosphorylation are coordinately downregulated in human diabetes. Nature Genetics. 34 (3), 267-273 (2003).
  30. Ashburner, M., et al. Gene ontology: tool for the unification of biology. The Gene Ontology Consortium. Nature Genetics. 25 (1), 25-29 (2000).
  31. Huang da, W., Sherman, B. T., Lempicki, R. A. Systematic and integrative analysis of large gene lists using DAVID bioinformatics resources. Nature Protocols. 4 (1), 44-57 (2009).
  32. Huang da, W., Sherman, B. T., Lempicki, R. A. Bioinformatics enrichment tools: paths toward the comprehensive functional analysis of large gene lists. Nucleic Acids Research. 37 (1), 1-13 (2009).
  33. Evaluating RNA Quality from FFPE Samples. Illumina Available from: https://www.illumina.com/content/dam/illumina-marketing/documents/products/technotes/evaluating-rna-quality-from-ffpe-samples-technical-note-470-2014-001.pdf (2016)

Nachdrucke und Genehmigungen

Genehmigung beantragen, um den Text oder die Abbildungen dieses JoVE-Artikels zu verwenden

Genehmigung beantragen

Weitere Artikel entdecken

GenetikAusgabe 160RNA Sequenzierungformalinfixiertes Paraffin eingebettetFFPENext Generation SequenzierungNGSRNA Seq Analyse

This article has been published

Video Coming Soon

JoVE Logo

Datenschutz

Nutzungsbedingungen

Richtlinien

Forschung

Lehre

ÜBER JoVE

Copyright © 2025 MyJoVE Corporation. Alle Rechte vorbehalten