Nous utilisons le séquençage génétique des virus pour essayer de comprendre d’où viennent les virus et comment ils se propagent. Et pour utiliser ces données en temps réel, par exemple lors d’une épidémie, nous devons comprendre exactement à quel point les données sont exactes que nous fournissons. Les principaux avantages de ces techniques sont qu’il est relativement bon marché, il est rapide, et il permet le codage de base en temps réel qui peut être utilisé pour le séquençage sur le terrain.
Cette méthode peut être utilisée pour la génération en temps opportun de données de séquence qui, par exemple, peuvent être utilisées pour déterminer l’origine d’une multitude d’agents pathogènes. Cette technique peut être complexe pour les utilisateurs pour la première fois et des connaissances de base Unix sont nécessaires. Surtout pour l’installation des différents logiciels.
La visualisation de cette méthode aidera les utilisateurs à déterminer le taux d’erreur de leurs protocoles spécifiques de séquençage. Et pour répondre aux questions de recherche. L’exécuter de séquence est commencé sur un MinION connecté au MinIT.
Après avoir préformé une séquence sur la plate-forme Nanopore, chargez la charge de données dans Porechop. Pour prévenir la contamination et améliorer la précision, utilisez le soulignement de deux, soulignez le drapeau des codes à barres et entrez la commande comme indiqué. Après le dé-multiplexage, utilisez cutadapt pour supprimer les séquences et séquences d’amorce d’une longueur inférieure à 75 nucléotides utilisant la commande comme indiqué.
Utilisez Minimap2 pour cartographier les séquences de de-multiplex lues contre le panneau de souches de référence distinctes à l’aide de Minimap2. Et utilisez Samtools pour générer une séquence consensuelle. Pour les alignements basés sur la référence, il est essentiel de préformer une explosion et de rechercher avec la séquence de consensus générée pour identifier la souche de référence la plus proche.
Répétez ensuite l’alignement basé sur la référence avec la souche de référence la plus proche comme référence. Pour déterminer la couverture de lecture requise pour compenser le profil d’erreur dans le séquençage Nanopore, sélectionnez la cartographie de séquence à un Amplicon et utilisez Minimap2 pour cartographier les lectures Nanopore par rapport à cet Amplicon. Utilisez Samtools pour sélectionner uniquement la cartographie des lectures à Amplicon26 et pour convertir le fichier bam en fastq en utilisant les commandes comme indiqué.
Sélectionnez aléatoirement des sous-ensembles de 200 séquences, par exemple, lus mille fois. Toutes les lectures de séquence sélectionnées au hasard sont alignées sur Amplicon26. Utilisez KMA pour cartographier les lectures de séquence et générer immédiatement une séquence consensuelle à l’aide des paramètres optimisés pour le séquençage nanopore, comme l’indique le drapeau nano de la Colombie-Britannique.
Pour inspecter les séquences consensuelles générées, utilisez les commandes comme indiqué. Pour afficher le taux d’erreur dans le txt de points de statistiques sous le titre, le taux d’erreur inadéquation les bases cartographiées, utilisez la commande comme indiqué. Pour afficher le nombre d’indels affiché sous le titre indels par cycle, utilisez la commande comme indiqué.
L’utilisation de la nouvelle cellule d’écoulement en combinaison avec la tong couleur de base, une couverture lue de 40 fois entraîne des résultats identiques par rapport au séquençage Illumina. Une couverture lue de 30 fois entraîne un taux d’erreur de 0,02%, ce qui correspond à une erreur sur 585 000 nucléotides séquencés. Alors qu’une couverture lue de 20 fois entraîne une erreur sur 63, 529 nucléotides séquencés.
Une couverture lue de 10 fois entraîne une erreur sur 3 312 nucléotides séquencés. Ce qui signifie que plus de 3 nucléotides par quatre génomes du virus Usutu sont appelés erronés. Avec une couverture lue supérieure à 30 fois, aucun indélébile n’est observé.
Une couverture lue de 20 fois entraîne la détection d’une position indélébile tandis qu’une couverture lue de 10 fois entraîne des indéligibles dans 29 postes. La chose la plus importante à retenir est que, bien que pas toujours apparente, les mises à jour dans les logiciels se produisent fréquemment et peuvent influencer les résultats. Il existe plusieurs options de logiciels à utiliser.
Nous avons démontré les programmes les plus couramment utilisés. Mais différents logiciels et différentes versions de ces logiciels peuvent entraîner des résultats différents. Nous vous avons montré un exemple de la façon dont nous vérifions la qualité des données de séquence que nous générons.
Et c’est essentiel pour un soutien fiable en cas d’épidémie.