Dieses umfassende Protokoll weist an, wie man enge Genome verschiedener Harnbakterien generiert und ermöglicht es Lesern ohne Programmiererfahrung, terminalbasierte Genomassemblierungs- und Analysepipelines erfolgreich zu implementieren. Vollständige Genom-Assemblierungen ermöglichen die Entdeckung von Genen, die zur Kolonisierung und Virulenz zwischen kommensalen und uropathogenen Bakterien beitragen. Enge Genome geben Einblick in die Genomarchitektur und mobile genetische Elemente.
Die hybride Genom-Assemblierungsmethode kann auf alle kultivierbaren Bakterien angewendet werden, die aus anderen anatomischen Stellen oder Umweltnischen isoliert wurden, um ähnliche Einblicke in den Genomgehalt und die Architektur zu erhalten. Befolgen Sie das Protokoll und die Herstelleranleitung, um einen doppelsträngigen DNA-Pool vorzubereiten, und fahren Sie mit der Reinigung fort, indem Sie dem DNA-Pool das 2,5-fache Volumen paramagnetischer Perlen hinzufügen und dann das Röhrchen vorsichtig streichen, um den Inhalt zu mischen. Drehen Sie die Probe kurz bei 2.000 mal G herunter und legen Sie die Probe für fünf Minuten bei Raumtemperatur auf einen Rotator, dann pelletieren Sie die Perlen auf dem Magneten.
Als nächstes waschen Sie das Pellet zweimal mit 250 Mikrolitern frisch zubereitetem 70% Ethanol in nukleasefreiem Wasser, ohne das Pellet zu stören. Lassen Sie das Rohr während des Waschens auf dem Magneten. Nach jeder Wäsche Ethanol absaugen, dann die Probe kurz bei 2.000 mal G herunterdrehen, bevor sie zum Magneten zurückgebracht wird.
Restethanol pipettieren und das Pellet 30 Sekunden trocknen lassen. Nach dem Trocknen resuspendieren Sie das Pellet in 60 bis 70 Mikroliter nukleasefreiem Wasser und inkubieren Sie die Probe bei Raumtemperatur für zwei Minuten, dann pelletieren Sie die Probe auf dem Magneten, bis die Elute klar ist. Die Elute in ein sauberes 1,5 Milliliter Mikrozentrifugenröhrchen geben.
Quantifizieren Sie den konzentrierten doppelsträngigen DNA-Pool mit einem Fluorometer und bereiten Sie dann ein Aliquot von 700 Nanogramm der Probe in einem Endvolumen von 65 Mikrolitern vor, um mit dem Adapterligationsschritt fortzufahren und den Rest des Pools bei vier Grad Celsius für einen zweiten Durchlauf nach Abschluss des ersten Laufs zu halten. Fahren Sie mit der Adapterligatur gemäß den Anweisungen des Herstellers fort. Um mit der Sequenzierung fortzufahren, mischen Sie die Priming-Puffer und primen Sie die Flusszelle.
Bereiten Sie die DNA-Bibliothekslösung vor und laden Sie die Probe dropweise auf den Ladeanschluss. Starten Sie den Sequenzierungslauf. Öffnen Sie die Betriebssoftware für die Sequenzierung und klicken Sie auf die Schaltfläche Start, dann geben Sie einen Namen für das Experiment ein.
Gehen Sie zu Weiter zur Kit-Auswahl, um das entsprechende Bibliotheksvorbereitungskit und Barcode-Erweiterungspaket auszuwählen, und klicken Sie dann auf Weiter, um optionen auszuführen. Wenn Sie eine ausreichende Bibliothek für einen zweiten Durchlauf vorbereiten möchten, passen Sie die Laufzeitlänge von standardmäßig 72 Stunden auf 48 Stunden an, und drücken Sie weiter auf Basecalling. Überprüfen Sie die Basecalling-Option in config fast basecalling.
Setzen Sie barcoding auf aktiviert, damit die Ausgabe-FASTQ von den Barcode-Sequenzen abgeschnitten und in separate Verzeichnisse basierend auf Barcodes de-multiplexiert wird. Klicken Sie auf Weiter zur Ausgabe. Wählen Sie als Nächstes aus, wo die Ausgabesequenzierungsdaten gespeichert werden sollen.
Erwarten Sie etwa 30 bis 50 Gigabyte Daten, wenn Sie nur die FASTQ-Ausgabe speichern, und mehr als 500 Gigabyte Daten, wenn Sie die FAST5-Ausgabe speichern. Wenn Sie nach der Sequenzierung mit der manuellen Filterung fortfahren möchten, deaktivieren Sie die Filteroption Qscore seven in der Leselänge ungefiltert. Andernfalls lassen Sie die Option aktiviert.
Gehen Sie zur Registerkarte Setup weiter ausführen, um alle Einstellungen zu überprüfen. Wenn die Einstellungen korrekt sind, klicken Sie auf die Schaltfläche Start. Andernfalls klicken Sie auf Zurück, um die erforderlichen Anpassungen vorzunehmen.
Erstellen Sie im Long-Reads-Verzeichnis neue Verzeichnisse für jeden Barcode, der im Lauf verwendet wird. Kopieren Sie alle fastq-Dateien, die jedem Barcode entsprechen, in den entsprechenden Ordner. Kombinieren Sie alle fastq-Dateien für jeden Barcode aus jedem Lauf.
Sobald die Dateien kombiniert sind, öffnen Sie das Terminal und navigieren Sie mit dem Befehl cd zu den Barcode-Verzeichnissen innerhalb des langen Leseverzeichnisses. Um alle fastq-Dateien pro Barcode in einer einzigen fastq-Datei zu verketten, führen Sie den Befehl aus und wiederholen Sie den Vorgang für jeden Barcode. Verwenden Sie NanoStat, um die Lesequalität der Probe zu bewerten, indem Sie den Befehl ausführen, und zeichnen Sie dann die Ergebnisse auf, indem Sie die Ausgabe zur späteren Bezugnahme in eine Text- oder Word-Datei kopieren.
Nachdem die Ergebnisse gespeichert wurden, verwenden Sie NanoFilt, um MinION-Lesevorgänge zu filtern, indem Sie Lesevorgänge mit Q kleiner als sieben und einer Länge von weniger als 200 verwerfen, indem Sie den Befehl ausführen. Führen Sie in der generierten zugeschnittenen Datei NanoStat mit dem Befehl aus. Zeichnen Sie die Ergebnisse auf, indem Sie die Ausgabe in eine Text- oder Word-Datei kopieren und mit den vorherigen Ergebnissen vergleichen, um sicherzustellen, dass die Filterung erfolgreich war.
Wiederholen Sie die Schritte für jeden Barcode, der im Sequenzierungslauf verwendet wird. Um eine hybride Genomassemblierung zu generieren, organisieren Sie die kurz gelesenen Dateien und die lang gelesenen Dateien in einem einzigen Verzeichnis mit dem Namen trimmed_reads. Das Verzeichnis enthält also ein zuvor generiertes fastq.
gz-Datei für getrimmte lange Lesevorgänge und zwei fastq. gz-Dateien als R1 und R2 für getrimmte kurze Lesevorgänge. Navigieren Sie zu dem Verzeichnis trimmed_reads, in dem die gelesenen Dateien mit dem Befehl cd im Terminal gespeichert sind.
Sobald Sie sich im richtigen Verzeichnis befinden, zippen Sie die beiden kurz gelesenen Dateien, um sie im fastq zu speichern. gz-Formatierung durch Ausführen des Befehls. Wiederholen Sie den Schritt für R1 und R2. Stellen Sie sicher, dass sich alle gelesenen Dateien im fastq befinden.
gz-Formatieren und überprüfen Sie, ob alle Dateien mit demselben Isolat übereinstimmen. Starten Sie die Hybridassembly mit Unicycler, indem Sie den Befehl ausführen. Wenn der Lauf abgeschlossen ist, überprüfen Sie den Einradfahrer.
Protokolldatei, um sicherzustellen, dass keine Fehler auftreten. Notieren Sie die Anzahl, Größe und den vollständigen oder unvollständigen Status des generierten Kontexts. Wenn unvollständige Kontexte im Unicycler-Protokoll identifiziert werden, führen Sie Unicycler im Fettdruckmodus erneut aus, indem Sie dem Befehl das Flag hinzufügen.
Öffnen Sie Bandage und klicken Sie auf Datei, wählen Sie dann Lastdiagramm und wählen Sie die Baugruppe aus. gfa-Datei, die zuvor auf dem von Unicycler generierten unicycler_output_directory gespeichert wurde. Sobald die Datei geladen ist, klicken Sie auf die Schaltfläche Diagramm zeichnen auf der linken Symbolleiste und bewerten Sie, ob die Baugruppe abgeschlossen ist, indem Sie untersuchen, wie die Contigs verbunden und organisiert sind.
Navigieren Sie innerhalb des Terminals mit dem Befehl cd zu dem Ordner, in dem die Unicycler-Ausgabe gespeichert ist. Führen Sie dann das quast-Protokoll aus, indem Sie den Befehl ausführen. Überprüfen Sie die von quast generierten Berichte im Ausgabeverzeichnis quast_output_directory.
Navigieren Sie innerhalb des Terminals zu dem Ordner, in dem die Unicycler-Ausgabe mit dem Befehl cd gespeichert ist, und führen Sie dann prokka aus, indem Sie den Befehl ausführen. Überprüfen Sie die Anmerkungen, indem Sie die tsv-Tabelle öffnen und die generierte gff-Datei in die Sequenzanalysesoftware hochladen. Visualisieren und analysieren Sie die Anmerkungen in der Software.
In den repräsentativen Gelbildern werden genomische DNA- oder gDNA-Extraktionsergebnisse dargestellt. Eine erfolgreiche Extraktion und Trennung von intakter gDNA kann beobachtet werden. Eine erfolglose Extraktion, die eine fragmentierte gDNA- und RNA-Kontamination zeigt, wird ebenfalls dargestellt.
Die Genom-Assemblierungsgraphen von Bakterien wurden durch Unicycler Hybrid de novo Assembly erzeugt und durch Bandage visualisiert. Das vollständige Genom von Klebsiella oxytoca KoPF10 zeigte ein einzelnes geschlossenes Chromosom und das vollständige Genom von Klebsiella pneumoniae KpPF25 bestand aus einem geschlossenen Chromosom und fünf geschlossenen Plasmiden. Das unvollständige Chromosom von Klebsiella pneumoniae KpPF46 bestand aus zwei miteinander verbundenen Contigs.
Die von Geneious Prime generierten Montagekarten für das vollständige Genom von Klebsiella oxytoca KoPF10 und Klebsiella pneumoniae KpPF25 zeigen annotierte Gene, die durch farbige Pfeile entlang des Plasmidrückgrats gekennzeichnet sind. Um sicherzustellen, dass das Laden der Durchflusszellen erfolgreich ist, filtern Sie lange Lesevorgänge mit den empfohlenen Einstellungen und stellen Sie sicher, dass sich alle Dateien im fastq befinden. gz-Format.
Führen Sie den richtigen Unicycler-Befehl mit Dateien aus, die zum selben Beispiel gehören.