Ce protocole complet enseigne comment générer des génomes proches de diverses bactéries urinaires et permet aux lecteurs sans expérience en codage de mettre en œuvre avec succès des pipelines d’assemblage et d’analyse de génomes basés sur des terminaux. Des assemblages complets de génomes permettent la découverte de gènes contribuant à la colonisation et à la virulence des bactéries commensales et uropathogènes. Les génomes proches donnent un aperçu de l’architecture du génome et des éléments génétiques mobiles.
La méthode d’assemblage du génome hybride peut être appliquée à toute bactérie cultivable isolée d’autres sites anatomiques ou niches environnementales pour fournir des informations similaires sur le contenu et l’architecture du génome. Suivez le protocole et le guide du fabricant pour préparer un pool d’ADN double brin et procédez au nettoyage en ajoutant 2,5 fois le volume de perles paramagnétiques au pool d’ADN, puis en agitant doucement le tube pour mélanger le contenu. Faites tourner brièvement l’échantillon à 2 000 fois G et placez l’échantillon sur un rotateur pendant cinq minutes à température ambiante, puis abattez les billes sur l’aimant.
Ensuite, lavez la pastille deux fois avec 250 microlitres d’éthanol à 70% fraîchement préparé dans de l’eau sans nucléase sans perturber la pastille. Laissez le tube sur l’aimant pendant les lavages. Aspirer l’éthanol après chaque lavage, puis faire tourner brièvement l’échantillon à 2 000 fois G avant de le renvoyer à l’aimant.
Pipette sur l’éthanol résiduel et laisser sécher le granulé pendant 30 secondes. Une fois séché, remettez en suspension la pastille dans 60 à 70 microlitres d’eau sans nucléase et incubez l’échantillon à température ambiante pendant deux minutes, puis abattez l’échantillon sur l’aimant jusqu’à ce que l’élute soit clair. Transférer l’éluat dans un tube de microcentrifugation propre de 1,5 millilitre.
Quantifier le pool d’ADN double brin concentré à l’aide d’un fluoromètre, puis préparer une aliquote de 700 nanogrammes de l’échantillon dans un volume final de 65 microlitres pour passer à l’étape de ligature de l’adaptateur et conserver le reste du pool à quatre degrés Celsius pour une deuxième série après la fin de la première série. Continuez avec la ligature de l’adaptateur conformément aux instructions du fabricant. Pour procéder au séquençage, mélangez les tampons d’amorçage et amorcez la cellule d’écoulement.
Préparez la solution de bibliothèque d’ADN et chargez l’échantillon par goutte sur le port de chargement. Démarrez l’exécution du séquençage. Ouvrez le logiciel d’exploitation pour le séquençage et cliquez sur le bouton démarrer, puis entrez un nom pour l’expérience.
Allez pour continuer à la sélection du kit pour sélectionner le kit de préparation de bibliothèque approprié et le pack d’extension de code-barres utilisé, puis cliquez sur Continuer pour exécuter les options. Si vous prévoyez de préparer une bibliothèque suffisante pour une deuxième exécution, ajustez la durée d’exécution de 72 heures par défaut à 48 heures et appuyez sur Continuer jusqu’à basecalling. Cochez l’option basecalling dans config fast basecalling.
Définissez le codage à barres sur activé afin que la sortie FASTQ soit coupée des séquences de codes à barres et démultipliée dans des répertoires distincts en fonction du code-barres. Cliquez sur Continuer pour sortir. Ensuite, choisissez où enregistrer les données de séquençage de sortie.
Attendez-vous à environ 30 à 50 gigaoctets de données si vous enregistrez uniquement la sortie FASTQ et plus de 500 gigaoctets de données si vous enregistrez la sortie FAST5. Si vous prévoyez de procéder à un filtrage manuel après le séquençage, décochez l’option de filtrage Qscore sept en longueur de lecture non filtrée. Sinon, laissez l’option cochée.
Allez pour continuer à exécuter l’onglet de configuration pour passer en revue tous les paramètres. Si les paramètres sont corrects, cliquez sur le bouton Démarrer. Sinon, cliquez sur Retour pour effectuer les ajustements nécessaires.
Dans le répertoire des lectures longues, créez de nouveaux répertoires pour chaque code-barres utilisé dans l’exécution. Copiez tous les fichiers fastq qui correspondent à chaque code-barres dans le dossier approprié. Combinez tous les fichiers fastq pour chaque code-barres de chaque exécution.
Une fois les fichiers combinés, ouvrez le terminal et accédez aux répertoires de codes-barres dans le répertoire de lectures longues à l’aide de la commande cd. Pour concaténer tous les fichiers fastq par code-barres en un seul fichier fastq, exécutez la commande et répétez la procédure pour chaque code-barres. Utilisez NanoStat pour évaluer la qualité de lecture de l’échantillon en exécutant la commande, puis enregistrez les résultats en copiant la sortie dans un fichier texte ou Word pour référence ultérieure.
Une fois les résultats enregistrés, utilisez NanoFilt pour filtrer les lectures MinION, en supprimant les lectures avec Q inférieur à sept et d’une longueur inférieure à 200 en exécutant la commande. Sur le fichier découpé généré, exécutez NanoStat avec la commande. Enregistrez les résultats en copiant la sortie dans un fichier texte ou Word et comparez-les aux résultats précédents pour vous assurer que le filtrage a réussi.
Répétez les étapes pour chaque code-barres utilisé dans l’exécution du séquençage. Pour générer un assemblage de génome hybride, organisez les fichiers à lecture courte et les fichiers à lecture longue dans un répertoire unique nommé trimmed_reads. Le répertoire contient donc un fastq précédemment généré.
gz pour les lectures longues découpées et deux fastq. gz au format R1 et R2 pour les lectures courtes découpées. Accédez au répertoire trimmed_reads qui stocke les fichiers lus à l’aide de la commande cd dans le terminal.
Une fois dans le bon répertoire, compressez les deux fichiers de lecture courte pour les stocker dans le fastq. gz en exécutant la commande. Répétez l’étape pour R1 et R2. Assurez-vous que tous les fichiers lus sont dans le fastq.
gz et vérifiez que tous les fichiers correspondent au même isolat. Commencez l’assemblage hybride à l’aide d’Unicycler en exécutant la commande. Une fois l’exécution terminée, passez en revue le monocycleur.
pour garantir l’absence d’erreurs. Enregistrez le nombre, la taille et l’état complet ou incomplet du contexte généré. Si des contextes incomplets sont identifiés dans le journal Unicycler, réexécutez Unicycler en mode gras en ajoutant l’indicateur à la commande.
Ouvrez Bandage et cliquez sur fichier, puis choisissez le graphique de charge et sélectionnez l’assemblage. gfa qui a été précédemment enregistré dans le unicycler_output_directory généré par Unicycler. Une fois le fichier chargé, cliquez sur le bouton dessiner le graphique dans la barre d’outils de gauche et évaluez si l’assemblage est terminé en examinant comment les contigs sont connectés et organisés.
Naviguez dans le terminal jusqu’au dossier qui stocke la sortie Unicycler à l’aide de la commande cd. Exécutez ensuite le protocole quast en exécutant la commande. Passez en revue les rapports générés par quast dans le répertoire de sortie quast_output_directory.
Naviguez dans le terminal jusqu’au dossier qui stocke la sortie Unicycler à l’aide de la commande cd, puis exécutez prokka en exécutant la commande. Passez en revue les annotations en ouvrant la table tsv et en téléchargeant le fichier gff généré dans le logiciel d’analyse de séquence. Visualisez et analysez les annotations dans le logiciel.
Dans les images de gel représentatives, les résultats de l’extraction de l’ADN génomique ou de l’ADNg sont représentés. Une extraction et une séparation réussies de l’ADNg intact peuvent être observées. Une extraction infructueuse montrant une contamination fragmentée de l’ADNg et de l’ARN est également représentée.
Les graphiques d’assemblage du génome des bactéries ont été générés par l’assemblage hybride de novo Unicycler et visualisés par Bandage. Le génome complet de Klebsiella oxytoca KoPF10 a démontré un seul chromosome fermé et le génome complet de Klebsiella pneumoniae KpPF25 était constitué d’un chromosome fermé et de cinq plasmides fermés. Le chromosome incomplet de Klebsiella pneumoniae KpPF46 était constitué de deux contigs interconnectés.
Les cartes d’assemblage générées par Geneious Prime pour le génome complet de Klebsiella oxytoca KoPF10 et Klebsiella pneumoniae KpPF25 montrant des gènes annotés désignés par des flèches colorées le long des épines dorsales plasmidiques. Pour garantir la réussite du chargement des cellules de flux, filtrez les lectures longues à l’aide des paramètres recommandés et assurez-vous que tous les fichiers sont dans le fastq. Format gz.
Exécutez la commande Unicycler correcte à l’aide de fichiers appartenant au même exemple.