Neue Sequenz Entdeckung durch subtraktive Genomics

Please note that all translations are automatically generated. Click here for the English version.

8.6K Views

•

09:40 min

•

January 25th, 2019

DOI :

10.3791/58877-v

January 25th, 2019

•

Kathryn C. Asalone¹, Megan M. Nelson¹, John R. Bracht¹

¹Biology Department, American University

Transkript

Unser Protokoll ist von Bedeutung, weil es verwendet werden kann, um genomische Sequenzen zu identifizieren, die nicht von mitreinigenden Sequenzen isoliert werden können, die selbst nur teilweise bekannt sein können. Die Hauptvorteile dieser Technik ist, dass es kostengünstig ist, mit meist freier Software, die heruntergeladen werden kann, sowie flexibel. Sie können es auf viele biologische Fragen anwenden.

Mögliche Anwendungen sind die Identifizierung bakterieller Impfstoffziele und die Identifizierung von Viren, deren Sequenzen sich extrem von bekannten Mikroben unterscheiden. Diese Methode kann auf jedes System angewendet werden, in dem das Unbekannte nicht experimentell getrennt werden kann, solange die Referenzsequenz ohne das genomische Ziel verfügbar ist. Diese Technik erfordert einige Versuch und Fehler, so Geduld ist wichtig.

Möglicherweise müssen Sie Probleme haben, die Programme zu schießen. Sie können Andere Programme als die hier beschriebenen verwenden. Verwenden Sie die Bedienungsanleitungen so weit wie möglich.

Eine visuelle Demonstration dieser Methode ist hilfreich, da die Rechenarbeit von einem grundlegenden Verständnis der Struktur der Befehlszeilenprogrammierung abhängt. Verwenden Sie zunächst Trimmomatic 0.32, um Beleuchtungsadapter und Basen niedriger Qualität zu entfernen. Verwenden Sie Birnenversion 0.9.11, um qualitativ hochwertige zusammengeführte Lesevorgänge aus trimmomatischen Ausgabe-gekoppelten Lesevorgängen mit Standardparametern zu erstellen.

Verwenden Sie dann Reptile Version 1.1, um fehlerbehaftet die durch Pear erzeugten Lesevorgänge zu korrigieren. Verwenden Sie schließlich Trinity Version 2.4.0 im Standardmodus, um die korrigierten Sequenzen zusammenzustellen. Verwenden Sie für strangspezifische Bibliotheken den Parameter SS_lib_type.

Die Ausgabe ist eine FASTA-Datei, die in einem neuen Verzeichnis namens trinity_output abgelegt wird. Erstellen Sie eine BLAST-Datenbank der Referenzsequenz nucleotide_reference. fasta an der Befehlszeile.

BLAST stimmte mit der Abfrage überein, die mit der Referenzdatenbank zusammengestellt wurde. Verwenden Sie BLAST_results, um eine Ausgabedatei zu erhalten. txt Um eine tabellarische Ausgabe zu generieren, die für Diesequenzverarbeitungsschritte mit Python-Skripten erforderlich ist, verwenden Sie outfmt 6 Für eine erhöhte Stringenz verwenden Sie Proteinsequenzen aus der Baugruppe als BLAST-Abfrage mit übersetztem Nukleotid BLAST, das eine sechsseitige Übersetzung der Nukleotiddatenbank durchführt.

Um Proteinsequenzen für die Abfrage zu erhalten, führen Sie den TransDecoder aus. Long0rfs-Befehl, um die längsten geöffneten Leserahmen aus zusammengesetzten Abfragesequenzen zu identifizieren. Führen Sie nun tblastn aus.

Stellen Sie bei Bedarf sicher, dass der richtige genetische Code für den untersuchten Organismus mit dem db_gencode mit entsprechender Codeoption ausgewählt wird. Wenn eine hochwertige Proteinreferenz verfügbar ist, verwenden Sie Protein-Protein-Matching mit Blastp anstelle von tblastn Machen Sie eine BLAST-Datenbank der Proteinreferenz. Stellen Sie sicher, dass Sie das Ergebnis als Datei für die Nachverarbeitung speichern, und verwenden Sie die Tabellarische Ausgabe, um sicherzustellen, dass die Python-Skripts sie korrekt analysieren können.

Verwenden Sie nun das subtraktive Python-Skript, um übereinstimmende Sequenzen zu entfernen. Um die Lesevorgänge der Assembly zuzuordnen, verwenden Sie BWA-MEM Version 0.7.12 oder bowtie 2, um die heruntergeladenen Rohlesevorgänge der Abfrageassembly zuzuordnen. Indexierung zunächst die Assembly, und ordnen Sie dann die Lesevorgänge zu.

Die Ausgabe wird SAM-Format sein. Führen Sie das Python-Skript removeUnmapped aus. py mit der SAM-Datei als Eingabe.

Dadurch werden die Namen von Abfragesequenzen ohne übereinstimmende Lesevorgänge identifiziert und in einer neuen Textdatei gespeichert. Die Ausgabe des vorherigen Schritts ist eine Liste von Sequenznamen in einer txt-Datei. Extrahieren Sie eine FASTA-Datei mit diesen Sequenzen.

Die Ausgabe ist eine Fasta-Datei. Verwenden Sie Genius, um optimale Primersequenzen manuell zu bestimmen. Markieren Sie eine Kandidatensequenz von 21 bis 28 Basispaaren für die Vorwärtsgrundierung, wodurch Durchläufe von vier oder mehr einer Basis vermieden werden.

Versuchen Sie, eine Region mit einer ziemlich gleichmäßigen Kombination aller Basispaare anzuvisieren. Ein einzelnes G oder C an drei Prime End ist von Vorteil und hilft, die Grundierung zu verankern. Klicken Sie auf die Registerkarte Statistik auf der rechten Seite des Bildschirms, um die geschätzte Schmelztemperatur dieser Sequenz anzuzeigen, wenn die Kandidatenregion hervorgehoben ist.

Ziel für eine Schmelztemperatur zwischen 55 und 60 Grad Celsius, unter Vermeidung von Wiederholungen, und lange Läufe von G C.Wählen Sie eine umgekehrte Grundierung in der gleichen Weise, gelegen 150 bis 250 Base-Paare drei Primzahl der vorderen Grundierung. Während die Grundierungslängen nicht übereinstimmen müssen, sollte die vorhergesagte Schmelztemperatur so nah wie möglich an der der vorderen Grundierung liegen. Achten Sie darauf, die Sequenz umzukehren, indem Sie mit der rechten Maustaste in Genius klicken, während eine Sequenz in einer Menüoption hervorgehoben wird.

Eine alternative Methode besteht darin, die Primer Design-Funktion zu verwenden, die sich in der oberen Symbolleiste im Sequenzfenster befindet. Fügen Sie die Region ein, um sie unter Zielregion zu verstärken. Geben Sie unter der Registerkarte Eigenschaften die gewünschte Größe, Schmelztemperatur und prozentweise G C ein, und klicken Sie dann auf OK, um Primer generieren zu lassen.

Um die quantitative PCR-Validierung der verbleibenden Sequenz durchzuführen, bereiten Sie zunächst ein Reaktionsgemisch für jede Vorlage in dreifacher Ausfertigung vor, mit unserem SYBR Green Master Mix, Vorwärts- und Rückwärtsprimern und Wasser, für ein Gesamtvolumen von 25 Mikrolitern. Führen Sie ein qPCR-Programm aus, das über die zuvor validierte Temperatur und Verlängerungszeit informiert ist. Endgültige Denaturierungskurven sollten mindestens beim ersten Einsatz der Primer in qPCR erzeugt werden, um die Amplifikation eines einzelnen DNA-Produkts zu validieren.

Messen Sie die qPCR SYBR Green Signale relativ zu Actin von Ct Für alle Fälle berechnen Sie den Durchschnitt und die Standardabweichung von zwei zum Ct relativ zu Actin. Führen Sie endpunkt-Gelelektrophorese durch, um die korrekte Produktgrößenerkennung durch qPCR zu bestätigen. Hier laufen 25 Mikroliter des qPCR-Produkts gemischt mit fünf Mikrolitern 6X Glitterol Farbstoff auf einem 2%TAE Agarose Gel bei 200 Volt für 20 Minuten.

Wenn Ihr qPCR zeigt, dass Sie die Zielsequenzen nicht identifiziert haben, wiederholen Sie den gesamten Zyklus mit einer neuen Referenz, die aus einer Online-Datenbank abgerufen werden kann. Das subtraktive Projekt begann in diesem Fall mit der Sequenzierung der RNA aus keimgefüttertem Gewebe von männlichen und weiblichen erwachsenen Zebrafinken. Letztlich wurden 935 somatische Gene identifiziert, die zuvor nicht in der gesamten Genom-Anmerkung enthalten waren.

Nach der Computerfilterung kann die quantitative PCR zu einem negativen Ergebnis führen, bei dem es keinen Unterschied in der Detektion zwischen Vogelgeweben gab. Umgekehrt wird ein positives Ergebnis, das die Identifizierung einer Wahren Zielsequenz darstellt, bestätigt, wenn die genomische DNA qPCR im Interessedesgewebe im Vergleich zur Referenz eine statistisch größere Detektion zeigt. Hier wurde das Alpha-Snap-Gen als Keimbahn-beschränkt validiert, weil es im somatischen Gewebe im Vergleich zur Teste-DNA erschöpft war, wo es vorhanden war, dass die Werte, die Actin entsprechen.

Es ist wichtig, sich daran zu erinnern, die richtigen Eingaben während jeder der Rechenschritte zu verwenden. Möglicherweise müssen Sie die Zyklussubtraktion mehrmals durchlaufen, um die Zielsequenz oder Sequenzen zu erhalten. Eine Vielzahl von phylogenetischen, strukturellen und funktionellen Analysen können an den entdeckten Genen durchgeführt werden.

Diese zusätzlichen Methoden geben Einblick in die evolutionären und funktionellen Rollen der Gene. Wir identifizierten das erste Gen auf einem keimlinienbeschränkten Singvogelchromosom, das das Interesse an diesem überraschenden genomischen Element erweiterte. Nachfolgende Arbeiten zeigten ähnliche Chromosomen bei vielen Singvogelarten, die viele zusätzliche Gene enthielten.

Zusammenfassung

Weitere Videos entdecken

genomische Subtraktion

De Novo Assemblierung

besser gekleideteres Design

Kapitel in diesem Video

0:04

Title

1:08

De novo Assemble Starting Sequence

2:03

BLAST the Assembly Against the Reference Sequence

4:44

Design Primers for the Sequence that Remains

6:25

qPCR Validation of the Remaining Sequence

7:51

Results: Example Data of qPCR Results Including Negative and Positive Outcomes

8:53

Conclusion

Ähnliche Videos

article

Eine Strategie, um de novo Mutationen in Common Störungen wie Autismus und Schizophrenie Identifizieren

25.7K Views

article

G2-Seq: Ein hoher Durchsatz Sequenzierung-basierten Methode zur Identifizierung von spät repliziert Regionen des Genoms

5.7K Views

article

Seltenes Ereigniserkennung mit Fehler korrigiert DNA und RNA Sequenzierung

12.0K Views

article

Gene Mining und Sequenzanalyse von Purin-Nukleosidase auf Basis von RNA-Seq

1.7K Views

article

Gene Mining und Sequenzanalyse von Purin-Nukleosidase auf Basis von RNA-Seq

1.7K Views

article

Mass Spectrometrie-Guided Genome Mining als Werkzeug zur Aufdeckung neuartiger Naturprodukte

10.8K Views

article

Sammlung und Extraktion von DNA-Speichel für Next Generation Sequencing

39.2K Views

article

Competitive Genomic Screens von Barcoded Hefe Bibliotheken

18.2K Views

article

Nachweis seltener Varianten von Genomic Pooled-Sequenzierung mit SPLINTER

15.1K Views

article

Next-Generation-Sequenzierung der ribosomalen 16S-RNA Gene Amplikons

83.3K Views

Copyright © 2025 MyJoVE Corporation. Alle Rechte vorbehalten