Method Article
Dieses Protokoll beschreibt einen umfassenden Ansatz für die Kultivierung, Sequenzierung und De-novo-Hybridgenomassemblierung von Harnbakterien. Es bietet ein reproduzierbares Verfahren zur Erzeugung vollständiger, zirkulärer Genomsequenzen, die bei der Untersuchung sowohl chromosomaler als auch extrachromosomaler genetischer Elemente nützlich sind, die zur Kolonisierung im Urin, zur Pathogenese und zur Verbreitung antimikrobieller Resistenzen beitragen.
Vollständige Genomsequenzen liefern wertvolle Daten für das Verständnis der genetischen Vielfalt und der einzigartigen Kolonisationsfaktoren von Urinmikroben. Diese Daten können mobile genetische Elemente wie Plasmide und extrachromosomale Phagen umfassen, die zur Verbreitung antimikrobieller Resistenzen beitragen und die Behandlung von Harnwegsinfektionen (UTI) weiter erschweren. Vollständige, geschlossene Genome bieten nicht nur eine feine Auflösung der Genomstruktur, sondern ermöglichen auch detaillierte vergleichende Genomik- und Evolutionsanalysen. Die Generierung vollständiger Genome de novo ist aufgrund der Einschränkungen der verfügbaren Sequenzierungstechnologie seit langem eine herausfordernde Aufgabe. Paired-End Next Generation Sequencing (NGS) erzeugt qualitativ hochwertige Kurzlesevorgänge, die oft zu genauen, aber fragmentierten Genomanordnungen führen. Im Gegenteil, die Nanoporensequenzierung liefert lange Lesevorgänge von geringerer Qualität, die normalerweise zu fehleranfälligen kompletten Baugruppen führen. Solche Fehler können genomweite Assoziationsstudien behindern oder irreführende Ergebnisse der Variantenanalyse liefern. Daher haben sich hybride Ansätze, die sowohl kurze als auch lange Lesevorgänge kombinieren, als zuverlässige Methoden herausgestellt, um hochgenaue geschlossene Bakteriengenome zu erhalten. Hierin wird eine umfassende Methode für die Kultur verschiedener Harnbakterien, die Speziesidentifizierung durch 16S rRNA-Gensequenzierung, die Extraktion genomischer DNA (gDNA) und die Generierung von kurzen und langen Lesevorgängen durch NGS- bzw. Nanopore-Plattformen beschrieben. Darüber hinaus beschreibt diese Methode eine bioinformatische Pipeline von Qualitätskontroll-, Assemblierungs- und Genvorhersagealgorithmen zur Erzeugung annotierter vollständiger Genomsequenzen. Die Kombination bioinformatischer Werkzeuge ermöglicht die Auswahl hochwertiger Lesedaten für die hybride Genomassemblierung und die nachgelagerte Analyse. Der in diesem Protokoll beschriebene gestraffte Ansatz für die hybride De-novo-Genomanordnung kann für die Verwendung in allen kultivierbaren Bakterien angepasst werden.
Das Urin-Mikrobiom ist ein aufstrebendes Forschungsgebiet, das ein jahrzehntelanges Missverständnis zerschlagen hat, dass die Harnwege bei gesunden Menschen steril sind. Mitglieder der Harnmikrobiota können dazu dienen, die Harnumgebung auszugleichen und Harnwegsinfektionen (UTI) zu verhindern1,2. Uropathogene Bakterien dringen in die Harnwege ein und nutzen verschiedene Virulenzmechanismen, um die ansässige Mikrobiota zu verdrängen, das Urothel zu besiedeln, Immunreaktionen zu entgehen und Umweltbelastungen entgegenzuwirken3,4. Urin ist ein relativ nährstoffarmes Medium, das durch hohe Osmolarität, begrenzte Stickstoff- und Kohlenhydratverfügbarkeit, geringe Sauerstoffversorgung und niedrigen pH-Wert5,6,7gekennzeichnet ist. Urin gilt auch als antimikrobiell, bestehend aus hohen Konzentrationen von inhibitorischem Harnstoff und antimikrobiellen Peptiden wie dem humanen Cathelicidin LL-378. Die Untersuchung von Mechanismen, die sowohl von ansässigen Bakterien als auch von Uropathogenen zur Besiedlung der Harnwege eingesetzt werden, ist entscheidend für das weitere Verständnis der Gesundheit der Harnwege und die Entwicklung neuer Strategien für die Behandlung mit Harnwegsinfektionen. Da das Versagen antimikrobieller Therapien an vorderster Front immer häufiger auftritt, wird es immer wichtiger, die Verbreitung mobiler genetischer Elemente zu überwachen, die antimikrobielle Resistenzdeterminanten in Populationen von Harnbakterien tragen9,10.
Um Genotypen und Phänotypen von Harnbakterien zu untersuchen, ist ihre erfolgreiche Kultur und anschließende Sequenzierung des gesamten Genoms (WGS) unerlässlich. Kulturabhängige Methoden sind notwendig, um lebensfähige Mikroben in Urinproben nachzuweisen und zu identifizieren11. Bei der klinischen Standard-Urinkultur werden Urin auf 5% Schafblutagar (BAP) und MacConkey-Agar plattiert und bei 35 °C für 24 h aerob inkubiert12. Mit einer Nachweisschwelle von ≥105 KBE/ml13werden jedoch viele Mitglieder der Urinmikrobiota durch diese Methode nicht berichtet. Verbesserte Kultivierungstechniken wie Enhanced Quantitative Urine Culture (EQUC)11 verwenden verschiedene Kombinationen unterschiedlicher Urinvolumina, Inkubationszeiten, Kulturmedien und atmosphärischer Bedingungen, um Mikroben zu identifizieren, die häufig von der Standardurinkultur übersehen werden. In diesem Protokoll wird eine modifizierte Version von EQUC beschrieben, hier als Modifiziertes Enhanced Urine Culture-Protokoll bezeichnet, das die Kultivierung verschiedener Harnbakterien und Uropathogene unter Verwendung selektiver Medien und optimaler atmosphärischer Bedingungen ermöglicht, aber nicht von Natur aus quantitativ ist. Die erfolgreiche Isolierung von Harnbakterien ermöglicht die Extraktion genomischer DNA (gDNA) für nachgeschaltete WGS und Genomassemblierung.
Genom-Assemblierungen, insbesondere komplette Assemblierungen, ermöglichen die Entdeckung genetischer Faktoren, die zur Kolonisierung, Nischenerhaltung und Virulenz sowohl bei ansässigen Mikrobiota als auch bei uropathogenen Bakterien beitragen können. Entwürfe von Genomassemblys enthalten eine Vielzahl von zusammenhängenden Sequenzen (Contigs), die Sequenzierungsfehler enthalten können und keine Orientierungsinformationen enthalten. In einer vollständigen Genomanordnung wurden sowohl die Orientierung als auch die Genauigkeit jedes Basenpaares verifiziert14. Darüber hinaus bietet die Gewinnung vollständiger Genomsequenzen Einblicke in die Genomstruktur, die genetische Vielfalt und die mobilen genetischen Elemente15. Kurze Lektüren allein können das Vorhandensein oder Fehlen wichtiger Gene identifizieren, aber möglicherweise nicht ihren genomischen Kontextbestimmen 16. Mit der Ermöglichung von Long-Read-Sequenzierungstechnologien wie Oxford Nanopore und PacBio erfordert die Erzeugung geschlossener De-novo-Assemblierungen bakterieller Genome keine anstrengenden Methoden wie das manuelle Schließen von De-novo-Assemblierungen durch Multiplex-PCR17,18. Die Kombination von Next Generation Short-Read-Sequencing und Nanopore Long-Read-Sequencing-Technologien ermöglicht die einfache Generierung genauer, vollständiger und geschlossener bakterieller Genom-Assemblierungen zu relativ geringen Kosten19. Die Short-Read-Sequenzierung erzeugt genaue, aber fragmentierte Genomanordnungen, die im Allgemeinen aus durchschnittlich 40-100 Contigs bestehen, während die Nanoporensequenzierung lange Lesevorgänge von etwa 5-100 kb Länge erzeugt, die weniger genau sind, aber als Gerüste dienen können, um Contigs zu verbinden und die genomische Syntenie aufzulösen. Hybride Ansätze, die sowohl Short-Read- als auch Long-Read-Technologien verwenden, können genaue und vollständige Bakteriengenome erzeugen19.
Hier wird ein umfassendes Protokoll für die Isolierung und Identifizierung von Bakterien aus menschlichem Urin, genomische DNA-Extraktion, Sequenzierung und vollständige Genomassemblierung unter Verwendung eines hybriden Assemblierungsansatzes beschrieben. Dieses Protokoll legt besonderen Wert auf die Schritte, die notwendig sind, um Lesevorgänge richtig zu modifizieren, die durch Short-Read- und Long-Read-Sequenzierung für die genaue Montage eines geschlossenen bakteriellen Chromosoms und extrachromosomaler Elemente wie Plasmide erzeugt werden.
Bakterien wurden aus Urin kultiviert, der von einwilligenden Frauen im Rahmen der vom institutionellen Überprüfungsausschuss genehmigten Studien 19MR0011 (UTD) und STU 032016-006 (UTSW) gesammelt wurde.
1. Modifizierte verstärkte Urinkultur
HINWEIS: Alle Kulturschritte müssen unter sterilen Bedingungen durchgeführt werden. Sterilisieren Sie alle Instrumente, Lösungen und Medien. Reinigen Sie den Arbeitsbereich mit 70% Ethanol, stellen Sie dann einen Bunsenbrenner auf und arbeiten Sie sorgfältig in der Nähe der Flamme, um die Wahrscheinlichkeit einer Kontamination zu verringern. Alternativ kann eine Biosicherheitswerkbank der Klasse II verwendet werden, um eine sterile Umgebung aufrechtzuerhalten. Tragen Sie eine geeignete persönliche Schutzausrüstung (PSA), um eine Exposition gegenüber potenziell pathogenen Mikroben zu vermeiden.
2. Identifizierung von Bakterienarten durch 16S rRNA Gen Sanger Sequenzierung
HINWEIS: Die mikrobielle Identität kann alternativ mit Matrix-Assisted Laser Desorption Ionization Time of Flight Mass Spectrometry (MALDI-TOF)20bestätigt werden.
3. Extraktion genomischer DNA (gDNA)
HINWEIS: Dieser Abschnitt verwendet Reagenzien und Spinsäulen, die im gDNA-Extraktionskit enthalten sind, auf das in der Materialtabelle verwiesen wird, für die ertragreiche Extraktion hochwertiger genomischer DNA aus verschiedenen Bakterienarten. Im Folgenden finden Sie empfohlene Änderungen und Anweisungen.
4. Bewertung der Qualität der extrahierten gDNA
5. Paired-End-Sequenzierung der nächsten Generation und Bibliotheksvorbereitung
HINWEIS: Short-Read-Sequenzierung kann auf verschiedenen Instrumenten mit unterschiedlichen Leselängen und Orientierungen durchgeführt werden. 150 bp (300 Zyklus) Paired-End-Sequenzierung wird für bakterielle WGS empfohlen. Sowohl die Vorbereitung als auch die Sequenzierung der Bibliothek können an Kerneinrichtungen oder kommerzielle Labors ausgelagert werden.
6. Vorbereitung der Nanoporen-MinION-Sequenzierungsbibliothek
7. Bewertung und Vorbereitung von Lesevorgängen
HINWEIS: Eine empfohlene Verzeichnisstruktur ist in Abbildung 4dargestellt. Erstellen Sie die auf dem Desktopgefundenen Verzeichnisse, d. h. Long_Reads, Short_Reads und Trimmed_Reads, bevor Sie mit den folgenden Berechnungsschritten fortfahren.
8. Hybridgenom-Assemblierung generieren
HINWEIS: Die folgende Montagepipeline verwendet Unicycler19,28,29,30, um kurze und lange Lesevorgänge zu kombinieren, die in den Abschnitten 7.1 und 7.2 vorbereitet wurden (Abbildung 3). Installieren Sie Unicycler und seine Abhängigkeiten und führen Sie die folgenden Befehle aus. Es wird davon ausgegangen, dass Dateien mit kurzer Lesezeit, die in Schritt 7.1.5 exportiert wurden, trimmed_short_file benannt sind. R1.fastq und trimmed_short_file. R2.fastq für Einfachheit.
9. Beurteilung der Montagequalität
HINWEIS: Das folgende Protokoll verwendet Bandage31 und QUAST32, zwei Programme, die vor der Verwendung eingerichtet werden müssen (Abbildung 2 und Abbildung 4). Bandage erfordert keine Installation nach dem Herunterladen und QUAST erfordert Vertrautheit mit der grundlegenden Befehlszeilenverwendung. Es wird auch empfohlen, die Vollständigkeit des Genoms mit Benchmarking Universal Single-Copy Orthologs (BUSCO)33zu bewerten.
10. Genom-Annotation
HINWEIS: Die folgende Anmerkungspipeline verwendet Prokka34, ein Befehlszeilentool, das vor der Verwendung installiert werden muss. Alternativ können Sie Prokka über die automatisierte GUI K-Base (Table of Materials) verwenden oder Genome über den Webserver RAST35 kommentieren. Wenn Genome in NCBI abgelegt werden, werden sie automatisch mit der Prokaryotic Genome Annotation Pipeline (PGAP)36annotiert.
11. Empfohlene Vorgehensweisen für die Datendemokratisierung
Dieses Protokoll wurde für die Kultivierung und Sequenzierung von Harnbakterien optimiert, die zu den in Abbildung 1aufgeführten Gattungen gehören. Nicht alle Harnbakterien sind mit dieser Methode kultivierbar. Kulturmedien und -bedingungen sind durch die Gattung in Abbildung 1spezifiziert. Exemplarische Gelelektrophorese-Bewertungen der gDNA-Integrität sind in Abbildung 2dargestellt. Ein Überblick über die Bioinformatik-Pipeline zur Sequenzierung von Leseverarbeitung, Genomassemblierung und Annotation ist in Abbildung 3 beschrieben. In Abbildung 4 wird ein Leitfaden für die rechnerische Verzeichnisstruktur bereitgestellt, um sowohl das Protokollverständnis zu vereinfachen als auch einen Rahmen für eine erfolgreiche Organisation bereitzustellen. Weiterhin sind repräsentative vollständige Genome von zwei Klebsiella spp., K. pneumoniae und K. oxytoca,enthalten, die durch dieses Protokoll erzeugt wurden. Eine Darstellung dieser Anordnungen ist in Abbildung 5 dargestellt und enthält auch ein zusätzliches unvollständiges Beispiel für das Genom von K. pneumoniae. Eine detaillierte Übersicht über jedes vollständig annotierte vollständige Genom ist in Abbildung 6 dargestellt. Schließlich wird in Tabelle 1 eine Zusammenfassung der Sequenzierungsstatistik bereitgestellt, um ein breites Verständnis der rohen und beschnittenen Daten zu bieten, die für die Erzeugung hochwertiger geschlossener Genomassemblys ausreichen. Zusätzlich vervollständigen Schlüsselparameter der beiden repräsentativen Klebsiella spp. Genome sind aufgelistet. Genome und Rohdaten wurden im Rahmen des BioProjekts PRJNA683049 in Genbank hinterlegt.
Abbildung 1: Modifizierte verstärkte Urinkultur verschiedener Harngattungen. Diagramm für die Agar- und Flüssigbrühe, die zur Kultivierung verschiedener Harngattungen verwendet werden kann. Es wird empfohlen, alle Kultivierungen bei 35 °C gemäß Unterabschnitt 1.1 durchzuführen. Kreise repräsentieren Medien, die für die Kultivierung einer bestimmten Gattung geeignet sind, Farben wurden willkürlich ausgewählt, um einen Medientyp von einem anderen zu unterscheiden. CDC-AN BAP (rot), CDC Anaerobe Schafblut-Agar; 5% Schaf-BAP (orange), Schafblut-Agar; BHI (grün), Gehirnherzinfusion; TSB (gelb), Tryptische Sojabrühe; CHROMagar Orientierung (blau). aGardnerella vaginalis sollte auf HBT Bilayer G. vaginalis Selektives Agar in mikroaerophiler Atmosphäre und unter besonderen Anforderungen an die Brühekultur kultiviert werden44. bLactobacillus iners sollten auf 5% Kaninchen-BAP-Platten und NYCIII-Brühe in mikroaerophiler Atmosphäre kultiviert werden. cLactobacillus spp. kann unter mikroaerophilen Bedingungen auf MRS kultiviert werden. Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.
Abbildung 2: Genomische DNA-Extraktion Agarose Gel Bilder. Repräsentative Gelbilder, die die Ergebnisse der gDNA-Extraktion darstellen. (A) Bahn 1: 1 kb Leiter, Spur 2: intakte gDNA für erfolgreiche Extraktion, Spur 3: Verschmieren, die auf fragmentierte gDNA hinweist. (B) Bahn 1: 1 kb Leiter, Bahnen 2 & 3: rRNA-Kontamination gekennzeichnet durch zwei Bänder zwischen 1,5 kb und 3 kb. Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.
Abbildung 3: Workflow für die Hybridgenomassemblierung. Schematische Darstellung der Schritte von der Lesequalitätskontrolle über die Vorverarbeitung bis hin zur Montageanmerkung. Durch das Zuschneiden von Lesevorgängen werden mehrdeutige Lesevorgänge mit geringer Qualität entfernt. Q-Score- und Längenparameter werden angezeigt und stellen die Lesevorgänge dar, die beibehalten werden. Die Assemblierung verwendet sowohl kurze als auch lange Lesevorgänge, um eine hybride De-novo-Genomanordnung zu erzeugen. Die Montagequalität wird anhand der Vollständigkeit und Korrektheit mit vorgegebenen Werkzeugen und Parametern bewertet. Die endgültige Genomanordnung wird für alle Gene und spezifischen Orte von Interesse annotiert. Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.
Abbildung 4:Strukturhandbuch für Bioinformatik-Verzeichnisse. Ein Schema der empfohlenen Verzeichnis- und Dateiorganisation für die Verarbeitung von kurzen und langen Lesevorgängen, hybrider Assemblierung und Genomannotation und QC. Wichtige Befehlszeilen-Datenverarbeitungsschritte werden neben den entsprechenden Dateien und Verzeichnissen hervorgehoben. Auslösen von Befehlen und Flags (fett), Eingabedateien (blau), Ausgabedateien oder -verzeichnissen (rot), Benutzereingaben wie Dateibenennungskonvention (Magenta). Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.
Abbildung 5: Genom-Assemblierungsgraphen nach Bandage. Repräsentative vollständige Genom-Assemblierungsgraphen von (A) Klebsiella oxytoca KoPF10 und (B) Klebsiella pneumoniae KpPF25 und unvollständige Genomassemblierung von (C) Klebsiella pneumoniae KpPF46. Das vollständige Genom von KoPF10 zeigt ein einziges geschlossenes Chromosom und das vollständige Genom von KpPF25 besteht aus einem geschlossenen Chromosom und fünf geschlossenen Plasmiden. Das unvollständige Chromosom von KpPF46 besteht aus zwei miteinander verbundenen Contigs. Unicycler hybrid de novo assembly erzeugt einen Montagegraphen, der durch Bandage visualisiert wird. Der Montagegraph liefert ein vereinfachtes Schema des Genoms, das geschlossene Chromosomen oder Plasmide durch einen Linker anzeigt, der zwei Enden eines einzelnen Kontinents verbindet. Das Vorhandensein von mehr als einem miteinander verbundenen Contig weist auf eine unvollständige Montage hin. Contig Größe und Tiefe können auch in Bandage vermerkt werden. Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.
Abbildung 6: Vollständige Genomkarten von annotierten Hybridbaugruppen. Von Geneious Prime erstellte Montagekarten für das vollständige Genom von (A) K. oxytoca KoPF10 und (B) K. pneumoniae KpPF25, die annotierte Gene zeigen, die durch farbige Pfeile entlang der Plasmidrückgrats gekennzeichnet sind. Chromosomen zeigen der Einfachheit halber nur rRNA- und tRNA-Gene. Genomannotationen wurden mit Prokka durchgeführt, wie in Abschnitt 10 dieses Protokolls angegeben. Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.
Tabelle 1: Repräsentativer Klebsiella spp.. vollständige Montageeigenschaften. Montageparameter des K. oxytoca-Stammes KoPF10 und des K. pneumoniae-Stammes KpPF25. Zugangsnummern für die hinterlegten Daten zu NCBI werden angegeben. Für beide Sequenzierungstechnologien wird die Anzahl der Lesevorgänge vor und nach dem Trimmen angegeben. N50 wird nur für lange Lesevorgänge bereitgestellt, da kurze Lesevorgänge eine kontrollierte Länge haben. Plasmid Replicon mit PlasmidFinder v2.1 Enteroebacteriaceae Datenbank mit Parametern auf 80% Identität und 60% Länge vorhergesagt. ein MLST, Multilocus Sequence Type. b CDS, Codierung von Sequenzen. c Plasmid-Replicon wurde mit der PlasmidFinder v2.1 Enterobacteriaceae-Datenbank mit Parametern von 80% Identität und 60% Länge vorhergesagt. d Oxford Nanopore Technologies (ONT) hinterlegte Lesedaten. e Illumina hinterlegte gelesene Daten. Bitte klicken Sie hier, um diese Tabelle herunterzuladen.
Das hier beschriebene umfassende Hybridgenom-Assemblierungsprotokoll bietet einen optimierten Ansatz für die erfolgreiche Kultivierung verschiedener Harnmikrobiota und Uropathogene und die vollständige Assemblierung ihrer Genome. Erfolgreiche WGS von Bakteriengenomen beginnt mit der Isolierung verschiedener und manchmal anspruchsvoller Mikroben, um ihre genomische DNA zu extrahieren. Bis heute fehlt den bestehenden Urinkulturprotokollen entweder die notwendige Empfindlichkeit, um viele Harnspezies zu erkennen, oder sie beinhalten langwierige und umfangreiche Ansätze, die längere Zeit und Ressourcen erfordern11. Der beschriebene Modified Enhanced Urine Culture-Ansatz bietet ein vereinfachtes und dennoch umfassendes Protokoll für die erfolgreiche Isolierung von Bakterien, die zu 17 häufigen Harngattungen gehören, einschließlich potenziell pathogener oder nützlicher kommensaler Spezies und sowohl fakultativer als auch obligater aerober oder anaerober Bakterien. Dies wiederum liefert das notwendige Ausgangsmaterial für eine genaue Sequenzierung und Assemblierung bakterieller Genome und für kritische phänotypische Experimente, die zum Verständnis von Harngesundheit und -krankheit beitragen. Darüber hinaus bietet dieser modifizierte Kulturansatz eine genauere klinische Diagnose von lebensfähigen Mikroorganismen, die in Urinproben vorkommen, und ermöglicht deren Biobanking für zukünftige genomische Studien. Dieses Protokoll ist jedoch nicht ohne Einschränkungen. Es kann je nach Organismus lange Inkubationszeiten sowie die Verwendung von Ressourcen wie einer Hypoxiekammer oder kontrollierten Inkubatoren erfordern, die möglicherweise nicht ohne weiteres verfügbar sind. Die Verwendung von anaeroben GasPaks bietet eine alternative Lösung, aber diese sind kostspielig und erzeugen nicht immer eine nachhaltige und kontrollierte Umgebung. Schließlich können Kulturverzerrungen sowie die Probenvielfalt es bestimmten Organismen und Uropathogenen ermöglichen, anspruchsvolle Bakterien zu übertreffen. Trotz dieser Einschränkungen wird durch diesen Ansatz eine Kultur verschiedener Harnbakterien ermöglicht.
Die genomische Sequenzierung hat mit der Weiterentwicklung der Next Generation Sequencing-Technologien an Popularität gewonnen, die sowohl die Ausbeute als auch die Genauigkeit der Sequenzierungsdaten enorm erhöht haben14,15. In Verbindung mit der Entwicklung von Algorithmen zur Datenverarbeitung und De-novo-Assemblierung stehen Anfängern und Fachwissenschaftlern komplette Genomsequenzen gleichermaßen zur Verfügung15,45. Das Wissen über die gesamte Genomorganisation, das durch vollständige Genome bereitgestellt wird, bietet wichtige evolutionäre und biologische Erkenntnisse, einschließlich Genduplikation, Genverlust und horizontaler Gentransfer14. Darüber hinaus sind Gene, die für antimikrobielle Resistenz und Virulenz wichtig sind, oft auf mobilen Elementen lokalisiert, die typischerweise nicht in Entwurfsgenomassemgruppen aufgelöst werden15,16.
Das hierin enthaltene Protokoll folgt einem hybriden Ansatz für die Kombination von Sequenzierungsdaten von Short-Read- und Long-Read-Plattformen, um vollständige Genom-Assemblierungen zu erzeugen. Während es sich auf bakterielle Genome im Urin konzentriert, kann dieses Verfahren an verschiedene Bakterien aus verschiedenen Isolationsquellen angepasst werden. Kritische Schritte in diesem Ansatz umfassen die Anwendung einer adäquaten sterilen Technik und die Verwendung geeigneter Medien- und Kulturbedingungen für die Isolierung reiner Harnbakterien. Darüber hinaus ist die Extraktion intakter, ertragreicher gDNA unerlässlich, um Sequenzierungsdaten frei von kontaminierenden Lesevorgängen zu generieren, die den Montageerfolg beeinträchtigen können. Nachfolgende Bibliotheksvorbereitungsprotokolle sind entscheidend für die Generierung von Qualitätslesevorgängen von ausreichender Länge und Tiefe. Daher ist es von äußerster Wichtigkeit, gDNA bei der Bibliotheksvorbereitung insbesondere für die Long-Read-Sequenzierung sorgfältig zu behandeln, da der größte Vorteil dieser Technologie die Generierung von langen Lesevorgängen ohne theoretische obere Längenbegrenzung ist. Ebenfalls beschrieben sind Abschnitte für die geeignete Qualitätskontrolle (QC) der Sequenzierung von Lesevorgängen, die verrauschte Daten eliminiert und das Montageergebnis verbessert.
Trotz erfolgreicher DNA-Isolierung, Bibliotheksvorbereitung und Sequenzierung kann die Art der genomischen Architektur einiger Arten immer noch ein Hindernis für die Erzeugung einer geschlossenen Genomanordnung darstellen45,46. Sich wiederholende Sequenzen erschweren oft die Montageberechnung, und trotz langer gelesener Daten können diese Bereiche mit geringer Zuverlässigkeit oder gar nicht aufgelöst werden. Lange Lesevorgänge müssen also im Durchschnitt länger sein als die größte Wiederholungsregion im Genom oder die Abdeckung muss hoch sein (>100x)19. Einige Genome können unvollständig bleiben und manuelle Ansätze zur Vervollständigung erfordern. Dennoch bestehen hybrid zusammengesetzte unvollständige Genome typischerweise aus weniger Contigs als kurz gelesene Entwurfsgenomen. Das Anpassen der Standardparameter des Baugruppenalgorithmus oder das Befolgen strengerer Cutoffs für die Lese-QC kann hilfreich sein. Alternativ besteht ein vorgeschlagener Ansatz darin, lange Lesevorgänge auf die unvollständigen Regionen auf der Suche nach Beweisen für den wahrscheinlichsten Montagepfad abzubilden und dann den Pfad unter Verwendung von PCR und Sanger-Sequenzierung der amplifizierten Region zu bestätigen. Mapping-Lesevorgänge mit Minimap2 wird vorgeschlagen und Bandage bietet ein nützliches Werkzeug für die Visualisierung von zugeordneten Lesevorgängen entlang zusammengesetzter Contigs, die Beweise für die Contig-Verknüpfungliefern 47.
Eine zusätzliche Herausforderung bei der Generierung vollständiger Genome liegt in der Vertrautheit und dem Komfort mit Befehlszeilenwerkzeugen. Viele bioinformatische Werkzeuge werden entwickelt, um jedem Benutzer Rechenmöglichkeiten zu bieten. Ihre Verwendung hängt jedoch von einem Verständnis der Grundlagen von UNIX und der Programmierung ab. Dieses Protokoll zielt darauf ab, ausreichend detaillierte Anweisungen bereitzustellen, damit Personen ohne vorherige Befehlszeilenerfahrung geschlossene Genomassemblys generieren und kommentieren können.
Die Autoren haben nichts preiszugeben.
Wir danken Dr. Moutusee Jubaida Islam und Dr. Luke Joyce für ihre Beiträge zu diesem Protokoll. Wir möchten auch die University of Texas am Dallas Genome Center für ihr Feedback und ihre Unterstützung danken. Diese Arbeit wurde von der Welch Foundation, Vergabenummer AT-2030-20200401 an N.J.D., von den National Institutes of Health, Preisnummer R01AI116610 an K.P., und vom Felecia and John Cain Chair in Women's Health, gehalten von P.E.Z.
Name | Company | Catalog Number | Comments |
Equipment: | |||
Bioanalyzer 2100 | Agilent | G29398A | Optional but recommended |
Centrifuge | Eppendorf | -- | Any centrifuge for spinning conicals and microcentrifuge tubes (e.g. Models 5810R/5424R) |
Electrophoresis | BioRad Laboratories | 1645070 | |
Gel Imaging System | BioRad Laboratories | ChemiDoc models | |
Incubator | ThermoFisher Scientific | -- | Any CO2 Incubator (e.g. Thermo Forma model 3110) |
Magnetic Rack | New England BioLabs | S15095 | 12-tube rack |
MinION | Oxford Nanopore Technologies | -- | |
Nanodrop | ThermoFisher Scientific | ND-ONE-W | |
NextSeq 500 | Illumina | SY-415-1002 | Other Illumina models are acceptable |
Plate Reader | BioTek | -- | Synergy H1 |
Qubit fluorometer | ThermoFisher Scientific | Q33238 | |
Rotator | Benchmark Scientific | H2024 | |
Thermocycler | ThermoFisher Scientific | -- | Any thermocycler for PCR reactions (e.g. ProFlex PCR system) |
Materials: | |||
10X Phosphate Buffered Saline (PBS) | Fisher Scientific | BP3991 | |
10X TBE buffer | -- | -- | 1M Tris,1M Boric Acid,0.2M EDTA (pH 8.0) |
1429R primer | Sigma Aldrich (Custom oligos) | -- | GGTTACCTTGTTACGACTT |
1kb Ladder | VWR | 101228-494 | |
1M Tris-Cl (pH 7.5) | ThermoFisher Scientific | 15567027 | |
6x Loading dye | Fisher Scientific | NC0783588 | |
8F primer | Sigma Aldrich (Custom oligos) | -- | AGAGTTTGATCCTGGCTCAG |
Agar | Fisher Scientific | BP1423-2 | |
Agarose | BioRad Laboratories | 63001 | |
AMPure XP Beads | Beckman Coulter | A63880 | |
Anaerobe Pouch System - GasPak EZ | BD Diagnostic Systems | B260683 | |
Boric Acid | Fisher Scientific | A73-500 | |
Brain Heart Infusion Broth | BD Diagnostic Systems | 212304 | |
CDC Anaerobe 5% Sheep Blood Agar | BD Diagnostic Systems | L007357 | |
CHROMagar Orientation | BD Diagnostic Systems | PA-257481.04 | |
DNeasy Blood & Tissue | QIAGEN | 69504 | |
DreamTaq Master Mix | ThermoFisher Scientific | K1081 | |
Dry Anaerobic Indicator Strips | BD Diagnostic Systems | 271051 | |
EDTA | Fisher Scientific | S311-500 | |
Ethanol 200 Proof | Sigma Aldrich | E7023 | For molecular biology |
Ethidium Bromide | ThermoFisher Scientific | BP130210 | |
Flow cell priming kit | Oxford Nanopore Technologies | EXP-FLP002 | |
Flow cell wash kit | Oxford Nanopore Technologies | EXP-WSH003 | |
Gel Extraction Miniprep Kit | BioBasic | BS654 | |
Ligation sequencing kit | Oxford Nanopore Technologies | SQK-LSK109 | |
Lysozyme | Research Products International Corp | L381005.05 | |
Mutanolysin | Sigma Aldrich | M9901-5KU | |
Native barcoding expansion 1-12 | Oxford Nanopore Technologies | EXP-NBD104 | |
NEB Blunt/TA Ligase Master Mix | New England BioLabs | M0367L | |
NEBNext FFPE DNA Repair Mix | New England BioLabs | M6630L | |
NEBNext quick ligation buffer | New England BioLabs | B6058S | |
NEBNext Ultra II End repair / dA-tailing module | New England BioLabs | E7546L | |
Nextera DNA CD Indexes | Illumina | 20018708 | |
Nextera DNA Flex Library Prep - (M) Tagmentation | Illumina | 20018705 | |
Nuclease-free water | Sigma Aldrich | W4502 | |
Qubit 1X dsDNA HS Assay Kit | ThermoFisher Scientific | Q33230 | |
Qubit Assay Tubes | ThermoFisher Scientific | Q32856 | |
Quick T4 DNA Ligase | New England BioLabs | E6056L | |
R9 Flow cell | Oxford Nanopore Technologies | FLO-MIN106D | |
RNase A | ThermoFisher Scientific | EN0531 | |
Sheep Blood | Hemostat Laboratories | DS13250 | |
TE buffer | -- | -- | 10mM Tris, 1mM EDTA (pH 8.0) |
Triton X-100 | Sigma Aldrich | T8787 | |
Tryptic Soy Broth | BD Diagnostic Systems | 211825 | |
Software & Bioinformatic Tools: | |||
Bandage | -- | -- | https://rrwick.github.io/Bandage/ |
Center for Genomic Epidemiology | -- | -- | http://www.genomicepidemiology.org/ |
CLC Genomics Workbench 12 | QIAGEN | -- | |
CRISPRcasFinder | -- | -- | https://crisprcas.i2bc.paris-saclay.fr/ |
FastQC | -- | -- | https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ |
Geneious Prime | Geneious | -- | |
gVolante (BUSCO) | -- | -- | https://gvolante.riken.jp/ |
Kbase Prokka Wrapper | -- | -- | https://kbase.us/applist/apps/ProkkaAnnotation/annotate_contigs/release |
Minimap2 | -- | -- | https://github.com/lh3/minimap2 |
MinKNOW | Oxford Nanopore Technologies | -- | |
NanoFilt | -- | -- | https://github.com/wdecoster/nanofilt |
NanoStat | -- | -- | https://github.com/wdecoster/nanostat |
PHASTER | -- | -- | https://phaster.ca/ |
Prokka | -- | -- | https://github.com/tseemann/prokka |
QUAST | -- | -- | http://quast.sourceforge.net/quast |
Trim Galore | -- | -- | https://www.bioinformatics.babraham.ac.uk/projects/trim_galore/ |
Trimmomatic | -- | -- | http://www.usadellab.org/cms/?page=trimmomatic |
Unicycler | -- | -- | https://github.com/rrwick/Unicycler#necessary-read-length |
Genehmigung beantragen, um den Text oder die Abbildungen dieses JoVE-Artikels zu verwenden
Genehmigung beantragenThis article has been published
Video Coming Soon
Copyright © 2025 MyJoVE Corporation. Alle Rechte vorbehalten