Usiamo il sequenziamento genetico dei virus per cercare di capire da dove provengono i virus e come si diffondono. E per usare questi dati in tempo reale, per esempio durante un'epidemia, dobbiamo capire esattamente quanto siano accurati i dati che forniamo. I principali vantaggi di queste tecniche sono che è relativamente economico, è veloce e consente la codifica di base in tempo reale che può essere utilizzata per il sequenziamento sul campo.
Questo metodo può essere utilizzato per la generazione tempestiva di dati di sequenza che, ad esempio, possono essere utilizzati per determinare l'origine di una moltitudine di agenti patogeni. Questa tecnica può essere complessa per gli utenti per la prima volta ed è richiesta la conoscenza unix di base. Soprattutto per l'installazione dei diversi pacchetti software.
La visualizzazione di questo metodo aiuterà gli utenti a determinare il tasso di errore dei loro protocolli di sequenziamento specifici. E per rispondere alle domande di ricerca. L'esecuzione della sequenza viene avviata su un MinION collegato al MinIT.
Dopo aver preformato una sequenza sulla piattaforma Nanopore, caricare il carico di dati in Porechop. Per prevenire la contaminazione e migliorare la precisione, utilizzare il flag richiedi carattere di sottolineatura due, contrassegnare i codici a barre di sottolineatura e inserire il comando come indicato. Dopo il de-multiplexing, utilizzare cutadapt per rimuovere sequenze primer e sequenze con una lunghezza inferiore a 75 nucleotidi usando il comando come indicato.
Utilizzate Minimap2 per mappare le letture della sequenza de-multiplex rispetto al pannello di ceppi di riferimento distinti utilizzando Minimap2. E usa Samtools per generare una sequenza di consenso. Per gli allineamenti basati su riferimenti, è essenziale preformare un'esplosione e cercare con la sequenza di consenso generata per identificare il ceppo di riferimento più vicino.
Ripetere quindi l'allineamento basato sul riferimento con la deformazione di riferimento più vicina come riferimento. Per determinare la copertura di lettura richiesta per compensare il profilo di errore nel sequenziamento nanopore, selezionare la mappatura della sequenza a un'Amplicon e utilizzare Minimap2 per mappare le letture del Nanopore rispetto a questa Amplicon. Utilizzare Samtools per selezionare solo il mapping delle letture in Amplicon26 e per convertire il file bam in fastq utilizzando i comandi indicati.
Selezionare casualmente sottoinsiemi di, ad esempio, 200 letture di sequenza mille volte. Tutte le letture di sequenza selezionate casualmente vengono allineate ad Amplicon26. Utilizzare KMA per mappare le letture della sequenza e generare immediatamente una sequenza di consenso utilizzando le impostazioni ottimizzate per il sequenziamento del Nanopore come indicato dal nanoflag BC.
Per ispezionare le sequenze di consenso generate, utilizzare i comandi come indicato. Per visualizzare il tasso di errore nelle statistiche dot txt sotto l'intestazione, il tasso di errore non corrisponde alle basi mappate, utilizzare il comando come indicato. Per visualizzare il numero di indeli visualizzati sotto le indelienze titolo per ciclo, utilizzare il comando come indicato.
Utilizzando la cella di flusso più recenti in combinazione con il flip-flop del colore di base, una copertura di lettura di 40 volte si traduce in risultati identici rispetto al sequenziamento Illumina. Una copertura di lettura di 30 volte si traduce in un tasso di errore dello 0,02% che corrisponde a un errore ogni 585.000 nucleotidi sequenziati. Mentre una copertura di lettura di 20 volte si traduce in un errore ogni 63, 529 nucleotidi sequenziati.
Una copertura di lettura di 10 volte si traduce in un errore ogni 3.312 nucleotidi sequenziati. Il che significa che oltre 3 nucleotidi per quattro genoma del virus Usutu sono chiamati sbagliati. Con una copertura di lettura superiore a 30 volte, non si osservano indeli.
Una copertura di lettura di 20 volte si traduce nei rilevamenti di una posizione indelebile, mentre una copertura di lettura di 10 volte si traduce in indeli in 29 posizioni. La cosa più importante da ricordare è che, sebbene non sempre apparente, gli aggiornamenti nel software si verificano frequentemente e possono influenzare i risultati. Ci sono diverse opzioni di software da utilizzare.
Abbiamo dimostrato i programmi più comunemente usati. Ma software diversi e diverse versioni di tali software possono comportare risultati diversi. Vi abbiamo mostrato un esempio di come controlliamo la qualità dei dati di sequenza che generiamo.
E questo è fondamentale per un supporto affidabile alle epidemie.