9.7K Views
•
11:04 min
•
May 19th, 2019
DOI :
May 19th, 2019
•Transkript
Mobile Elemente sind eine der Hauptquellen der menschlichen genetischen Instabilität. Das Verständnis ihrer Expression in verschiedenen Geweben und Bedingungen ist entscheidend, um ihre Auswirkungen auf das Genom zu verstehen. Die vielzahl von L1-Transkripten sind das Ergebnis der passiven Aufnahme von L1-bezogenen Sequenzen in andere Transkripte, die keine Rolle im L1-Lebenszyklus spielen.
Unser Ansatz beseitigt diesen irrelevanten Hintergrund. Dieses Protokoll kann an Studien von jedem mobilen Element oder sogar Viren in jeder Sequenz Genom angepasst werden. Es muss zumindest eine gewisse Sequenzvariation geben, um eine Diskriminierung zwischen loci zu ermöglichen.
Die visuelle Demonstration dieser Methode ist entscheidend für die Veranschaulichung der Stringenz und Sorgfalt, die erforderlich ist, um ausgedrückte L1-Wiederholungselemente auf der locus-spezifischen Ebene sicher zu identifizieren. Beginnen Sie dieses Verfahren mit der zytoplasmatischen RNA-Extraktion und der Sequenzierung der nächsten Generation, wie im Textprotokoll beschrieben. Durch die Auswahl der zytoplasmatischen RNA werden L1-bezogene Lesevorgänge, die innerhalb der introtronischen mRNA im Kern gefunden wurden, signifikant erschöpft.
In der Sequenzierungsbibliotheksvorbereitung umfasst ein weiterer Schritt zur Reduzierung von Transkriptionsgeräuschen, die nichts mit L1s zu tun haben, die Auswahl polyadenylierter Transkripte. Dadurch werden L1-bezogene Transkriptgeräusche entfernt, die bei Nicht-mRNA-Arten gefunden werden. Führen Sie die Ausrichtungsparadigmensequenzierung von FASTQ-Dateien mit der RNA-Seq-Probe von Interesse mit bowtie1 aus, indem Sie die Befehlszeile in das Linux-Terminal eingeben.
Diese Ausrichtungsstrategie erfordert, dass die Transkripte eindeutig und kollidierend mit einer umfassenden genomischen Suche abgestimmt werden. Diese Strategie bietet Vertrauen in das Aufrufen von Lesezuordnungen speziell für einen einzelnen L1-Standort. Strang trennen die Ausgabe-BAM-Dateien mit SAMtools und Linux-Befehle für den oberen Strang und den unteren Strang zu wählen.
Beachten Sie, dass die tatsächlichen Flagwerte variieren können, wenn sie keine Standardmäßigen Sequenzierungsprotokolle der nächsten Generation verwenden. Dieser Strangtrennschritt arbeitet, um das Transkriptionsrauschen herauszufiltern, das in L1-Sequenzen erzeugt wird, die nichts mit der L1-Retrotransposition zu tun haben, indem potenzielle Antisense-L1-bezogene zugeordnete Lesevorgänge eliminiert werden. Generieren Sie Lesezählungen anhand von Anmerkungen für L1-Loci mithilfe von Betthockern.
Geben Sie zuerst die Befehlszeile ein, um Lesezähler für L1s in der Sinnesrichtung auf dem oberen Strang zu generieren, und geben Sie dann die Befehlszeile ein, um Leseanzahl für L1s in der Sinnesrichtung am unteren Strang zu generieren. Die Zur Identifizierung von L1s verwendeten Anmerkungen bezeichnen L1s in voller Länge mit funktionalen Promotorregionen, die hintergrundgeräusche beseitigen, die sonst von abgeschnittenen L1s stammen. Erstellen Sie eine Tabelle für Lesevorgänge, die jedem annotierten L1-Lokus zugeordnet sind.
Kopieren Sie über die generierte Lesezähler-Textdatei, die für den unteren Strang erstellt wurde, und beschriften Sie die Seite als minus_bottom. Sortieren Sie alle Spalten basierend auf der höchsten bis niedrigsten Anzahl von Lesevorgängen in Spalte J.Copy über die generierte Textdatei für Lesezahlen, die für den oberen Strang erstellt wurde. Sortieren Sie alle Spalten basierend auf der höchsten bis niedrigsten Anzahl von Lesevorgängen in Spalte J.Und beschriften Sie die Seite als top_plus.
Erstellen Sie eine dritte Seite mit der Bezeichnung "kombiniert" und fügen Sie alle Loci mit 10 oder mehr Lesevorgängen aus minus_bottom und plus_top Seiten hinzu. Sortieren Sie alle Spalten basierend auf der höchsten bis niedrigsten Anzahl von Lesevorgängen in Spalte J.To die Mappbarkeit von Genomregionen unterstützen, insbesondere in oder in der Nähe von L1 loci, ganze Genom-gekoppelte und Sequenzierungsdateien der arten von Interesse wurden von NCBI heruntergeladen und in FASTQ-Dateien konvertiert, wie im Textprotokoll beschrieben. Indizieren Sie nun die BAM-Dateien, um sie im Integrativen Genomics Viewer, abgekürzt IGV, sichtbar zu machen, bevor Sie die Dateien laden.
In IGV laden Sie das Referenzgenom von Interesse, um annotierte Gene zu visualisieren. Laden Sie auch die Anmerkungsdatei für L1-Elemente in voller Länge, um die L1-Anmerkung, die BAM-Datei für die menschliche RNA-Expression, zu visualisieren, um zugeordnete Transkripte aus der Stichprobe von Interesse und die BAM-Datei für die Genom-Mappbarkeit des menschlichen Genoms zu visualisieren, um die Mappbarkeit genomischer Regionen zu bewerten. Entfernen Sie Abdeckungs- und Knotenzeilen, die jeder BAM-Datei zugeordnet sind.
Komprimieren Sie die BAM-Dateien für die menschliche RNA-Expression und für die Menschliche Genom-Mappbarkeit, so dass alle IGV-Spuren auf einem Bildschirm passen. Der letzte kritische Schritt bei der Beseitigung von Transkriptionsrauschen von L1-Sequenzen, die nichts mit l1-Retrotransposition zu tun haben, ist die manuelle Erstellung von L1-Dateien in voller Länge, die rna-Suchtranskripte zugeordnet haben. Die manuelle Kuration beinhaltet die Visualisierung jedes exprimierbaren L1-Lokus im Kontext seiner umgebenden genomischen Umgebung, um zu bestätigen, dass der Ausdruck vom L1-Promotor stammt.
Mithilfe von Koordinaten aus L1-Loci, die auf der kombinierten Tabellenseite aufgeführt sind, kuratieren Sie jeden L1-Lokus manuell mit eindeutig zugeordneten Transkripten, indem Sie ihre umgebende genomische Umgebung in IGV untersuchen. Kuratieren Sie einen Ort, der authentisch von sich aus ausgedrückt wird, wenn es keine Lesevorgänge stromaufwärts in L1-Richtung bis zu fünf Kilobasen gibt. Beschriften Sie die Zeile grün in Farbe und beachten Sie, warum es sich um ein authentisch ausgedrücktes L1 handelt. Eine Ausnahme von dieser Regel ist vorhanden, wenn die Region vor der L1 nicht zugeordnet werden kann.
Wenn dies der Fall ist, beschriften Sie die Zeile rot in Farbe, und beachten Sie, dass der Ausdruck des Bereichs vor dem L1-Promoter nicht ausgewertet werden kann und daher der Ausdruck des L1 nicht sicher bestimmt werden kann. Kuratieren Sie einen Ort, der nicht authentisch von seinem eigenen Promoter ausgedrückt wird, wenn es Lesungen vorgelagert bis zu fünf Kilobasen gibt. Beschriften Sie die Zeile rot in Farbe und beachten Sie, warum es sich nicht um ein authentisch ausgedrücktes L1 handelt. Kuratieren Sie einen Ort als falsch, wenn er in einem Intron eines exprimierten Gens in die gleiche Richtung exprimiert wird, mit Lesevorgängen vor dem L1, wenn er einem exprimierten Gen in die gleiche Richtung mit Lesevorgängen vor dem L1 nachgelagert ist, oder für unannotierte Expressionsmuster mit Lesevorgängen vor dem L1. Eine Ausnahme von dieser Regel gilt, wenn minimale Lesevorgänge direkt überlappen die L1-Promoter-Startsite, aber etwas vor der L1. Wenn es keine anderen Lesevorgänge vor einem L1-Fall wie diesem gibt, betrachten Sie diese L1 als authentisch ausgedrückt.
Beschriften Sie die Zeile grün und beachten Sie, warum es sich um ein authentisch ausgedrücktes L1 handelt. Kuratieren Sie einen L1-Lokus als wahrscheinlich falsch, wenn das Muster der zugeordneten Lesevorgänge zum Ort nicht mit den spezifischen L1-Regionen der Mappbarkeit korreliert. Wenn ein L1 sehr mappbar ist, aber nur einen Haufen Lesevorgänge in einem verdichteten Bereich innerhalb des L1 hat, ist es weniger wahrscheinlich, dass er mit dem L1-Ausdruck von seinem eigenen Promotor verwandt ist und eher aus nicht kommentierten Quellen wie Exons oder LTRs stammt. In Fällen wie diesem, kuratieren Sie die loci als orange und beachten Sie, warum der Ort verdächtig ist.
Überprüfen Sie die Quellen verdächtiger Anhäufungen, indem Sie den L1-Standort im UCSC Genome Browser überprüfen. Kuratieren Sie einen Ort, der nicht authentisch ausgedrückt wird, wenn er sich in einer genomischen Umgebung sporadisch ausgedrückter nicht annotierter Regionen befindet. Lesevorgänge können 10 Kilobasen vor dem L1 ausgedrückt werden. Aber alle 10 Kilobasen oder so, gibt es zugeordnete Lesungen und einige dieser Lesungen mit dem L1 ausgerichtet. Diese L1s haben wahrscheinlich Lesevorgänge aufgrund nicht annotierter Muster genomischer Expression zugeordnet.
In Fällen wie diesem, kuratieren Sie die loci als rot und beachten Sie, warum der Ort verdächtig ist. Um die Zuordnungsfähigkeit jedes L1-Loci zu unterstützen, bestimmen Sie die Anzahl der eindeutig zugeordneten Lesevorgänge zu L1 loci mit dem Bettwerkzeug-Programm, der FL-L1-Anmerkung und den ausgerichteten genomischen Sequenzdaten. Legen Sie einen L1-Standort für die vollständige Abdeckungs-Mappbarkeit fest, wenn 400 eindeutige Lesevorgänge darauf ausgerichtet sind.
Bestimmen Sie den Faktor, der erforderlich ist, um genomische DNA-ausgerichtete Lesevorgänge auf 400 für jedes einzelne L1 zu skalieren. Um ein skaliertes Maß der Expression nach der individuellen L1-Locus-Mappability zu erhalten, multiplizieren Sie den Faktor mit der Anzahl der RNA-Transkript-Lesevorgänge, die an einzelnen authentisch ausgedrückten L1s ausgerichtet sind. Jeder Schritt wird verwendet, um Unterschiede zwischen L1-Elementen hervorzuheben, die von ihrem eigenen Promotor ausgedrückt werden, und allen Möglichkeiten, wie L1-Elemente in andere Transkripte aufgenommen werden können, die nichts mit dem L1-Lebenszyklus zu tun haben. Hier sind Transkriptsliest zu sehen, die alle intakten L1s in voller Länge im menschlichen Genom in der DU145 Prostatatumor-Zelllinie exprimiert haben.
In Schwarz sind die spezifischen Loci, die nach der manuellen Kuration als authentisch ausgedrückt identifiziert werden. Und in rot sind die spezifischen loci abgelehnt als authentisch ausgedrückt liest nach manueller Kuration. In Grau sind loci mit weniger als 10 Lesevorgängen, die jedem zugeordnet sind.
Da diese Loci einen kleinen Bruchteil der Transkriptlesungen darstellen, wurden sie nicht manuell kuratiert. Ungefähr 4500 Loci werden nicht grafisch dargestellt, da sie null zugeordnete Lesevorgänge hatten. Nach der manuellen Kuration reicht die Anzahl der Lesevorgänge, die eindeutig zu authentisch ausgedrückten spezifischen L1-Loci in DU145 stammen, von 175 Lesevorgängen bis zu einem willkürlich gewählten Mindestschnitt von 10 Lesevorgängen.
Nachdem die Lesevorgänge für die Mappbarkeitswerte in jedem Ort angepasst wurden, nahm die Quantifizierung für die Expression für die meisten Loci zu. Die Anzahl der Lesevorgänge, die eindeutig auf authentisch ausgedrückte spezifische L1-Loci mit Mappbarkeitskorrekturen in DU145 abgebildet wurden, reichte von 612 bis vier Lesevorgängen, und es gab eine Neuordnung der höchsten bis niedrigsten ausdrückenden Loci. Jeder Schritt spielt eine entscheidende Rolle bei der Reduzierung des hohen Transkriptionshintergrundrauschens.
Der kritischste Schritt ist jedoch die manuelle Kuration jedes L1-Lokus, um die Transkription des eigenen Promotors zu bestätigen. Ungefähr 50 % der in DU145-Zellen bioinformatisch identifizierten L1-Loci wurden als L1-Hintergrundgeräusche aus anderen Transkriptionsquellen zurückgewiesen, wobei die strenge Strenge hervorgehoben wurde, die erforderlich ist, um zuverlässige Ergebnisse zu erzielen. Um den jüngsten L1s zu identifizieren, empfehlen wir die Verwendung von 5-Prime RACE-Auswahl von L1-Transkripten und Sequenzierungstechnologie wie PacBio, die längere Lesevorgänge nutzen und eine einzigartigere Zuordnung ermöglichen.
Mit diesem Ansatz können wir L1-Expressionsmuster streng und zuverlässig identifizieren und quantifizieren. Dies ebnet den Weg zu einem besseren Verständnis der Regulierung der einzelnen L1-Loci und der möglichen Auswirkungen.
Hier stellen wir einen bioinformatischen Ansatz und Analysen vor, um LINE-1-Ausdruck auf der ortsspezifischen Ebene zu identifizieren.
Kapitel in diesem Video
0:04
Title
0:52
Read Alignment Pipeline to Identify Expressed L1s
2:48
Manual Curation
7:48
Assess Mappability of Each L1 Loci to Factor in a Transcription Level Correction Score
8:42
Results: Identification of Full-length L1 Retroelements in the Human Prostate Tumor Cell Line, DU145
10:01
Conclusion
Ähnliche Videos
Copyright © 2025 MyJoVE Corporation. Alle Rechte vorbehalten