Utilizamos la secuenciación genética de virus para tratar de entender de dónde provienen los virus y cómo se propagan. Y para utilizar esos datos en tiempo real, por ejemplo durante un brote, tenemos que entender exactamente cuán precisos son los datos que proporcionamos. Las principales ventajas de estas técnicas son que es relativamente barato, es rápido y permite la codificación base en tiempo real que se puede utilizar para la secuenciación en el campo.
Este método se puede utilizar para la generación oportuna de datos de secuencia que, por ejemplo, se pueden utilizar para determinar el origen de una multitud de patógenos. Esta técnica puede ser compleja para los usuarios por primera vez y se requiere conocimiento básico de Unix. Especialmente para la instalación de los diferentes paquetes de software.
La visualización de este método ayudará a los usuarios a determinar la tasa de error de sus protocolos de secuenciación específicos. Y para responder preguntas de investigación. La ejecución de secuencia se inicia en un MinION conectado al MinIT.
Después de preformar una secuencia en la plataforma Nanopore, cargue la carga de datos en Porechop. Para evitar la contaminación y mejorar la precisión, utilice el indicador de subrayado dos de subrayado y escriba el comando como se indica. Después de la desmoción, utilice cutadapt para eliminar secuencias de imprimación y secuencias con una longitud inferior a 75 nucleótidos utilizando el comando como se indica.
Utilice Minimap2 para asignar lecturas de secuencia de desmoxos contra el panel de deformaciones unitarias de referencia distintas mediante Minimap2. Y usa Samtools para generar una secuencia de consenso. Para las alineaciones basadas en referencias, es esencial preformar una explosión y buscar con la secuencia de consenso generada para identificar la tensión de referencia más cercana.
A continuación, repita la alineación basada en referencia con la deformación unitaria de referencia más cercana como referencia. Para determinar la cobertura de lectura necesaria para compensar el perfil de error en la secuenciación de Nanopore, seleccione la asignación de secuencia a un Amplicon y utilice Minimap2 para asignar las lecturas de Nanopore contra este Amplicon. Utilice Samtools para seleccionar solo la asignación de lecturas a Amplicon26 y para convertir el archivo bam en fastq utilizando los comandos como se indica.
Seleccione aleatoriamente subconjuntos de, por ejemplo, 200 secuencias de lecturas mil veces. Todas las lecturas de secuencia seleccionadas aleatoriamente se alinean con Amplicon26. Utilice KMA para asignar las lecturas de secuencia y para generar inmediatamente una secuencia de consenso utilizando la configuración optimizada para la secuenciación de Nanopore como se indica en el indicador nano BC.
Para inspeccionar las secuencias de consenso generadas, utilice los comandos como se indica. Para mostrar la tasa de error en el punto txt de estadísticas bajo el encabezado, las bases de discordancias de la tasa de error asignadas, utilice el comando como se indica. Para mostrar el número de indels se muestra bajo el encabezado indels por ciclo utilice el comando como se indica.
Utilizando la celda de flujo más reciente en combinación con el flip-flop de color base, una cobertura de lectura de 40 veces da como resultado resultados idénticos en comparación con la secuenciación de Illumina. Una cobertura de lectura de 30 veces da como resultado una tasa de error de 0.02%que corresponde a un error en cada 585.000 nucleótidos secuenciados. Mientras que una cobertura de lectura de 20 veces resulta en un error en cada 63, 529 nucleótidos secuenciados.
Una cobertura de lectura de 10 veces da como resultado un error en cada 3, 312 nucleótidos secuenciados. Lo que significa que más de 3 nucleótidos por cada cuatro genomas del virus Usutu se llaman mal. Con una cobertura de lectura superior a 30 veces, no se observan indels.
Una cobertura de lectura de 20 veces da como resultado las detecciones de una posición indel mientras que una cobertura de lectura de 10 veces resulta en indels en 29 posiciones. Lo más importante a recordar es que, aunque no siempre son evidentes, las actualizaciones en el software se producen con frecuencia y pueden influir en los resultados. Hay varias opciones de softwares para usar.
Hemos demostrado los programas más utilizados. Pero diferentes software y diferentes versiones de esos softwares pueden resultar en resultados diferentes. Le hemos mostrado un ejemplo de cómo comprobamos la calidad de los datos de secuencia que generamos.
Y eso es fundamental para un apoyo fiable a los brotes.