Este protocolo integral instruye cómo generar genomas cercanos de diversas bacterias urinarias y permite a los lectores sin experiencia en codificación implementar con éxito tuberías de ensamblaje y análisis del genoma basadas en terminales. Los ensamblajes completos del genoma permiten el descubrimiento de genes que contribuyen a la colonización y virulencia entre las bacterias comensales y uropatógenas. Los genomas cercanos proporcionan información sobre la arquitectura del genoma y los elementos genéticos móviles.
El método de ensamblaje del genoma híbrido se puede aplicar a cualquier bacteria cultivable aislada de otros sitios anatómicos o nichos ambientales para proporcionar información similar sobre el contenido y la arquitectura del genoma. Siga el protocolo y la guía del fabricante para preparar un grupo de ADN de doble cadena y proceda a limpiar agregando 2.5 veces el volumen de cuentas paramagnéticas al grupo de ADN, y luego moviendo suavemente el tubo para mezclar el contenido. Gire brevemente la muestra a 2.000 veces G y coloque la muestra en un rotador durante cinco minutos a temperatura ambiente, luego pegue las perlas en el imán.
A continuación, lave el pellet dos veces con 250 microlitros de etanol 70% recién preparado en agua libre de nucleasas sin molestar el pellet. Deje el tubo en el imán durante los lavados. Aspire etanol después de cada lavado, luego gire brevemente la muestra a 2, 000 veces G antes de devolverla al imán.
Pipetee el etanol residual y deje que el pellet se seque durante 30 segundos. Una vez seco, vuelva a suspender el pellet en 60 a 70 microlitros de agua libre de nucleasa e incube la muestra a temperatura ambiente durante dos minutos, luego pegue la muestra en el imán hasta que el elutio esté claro. Transfiera el elute a un tubo de microcentrífuga limpio de 1,5 mililitros.
Cuantifique el grupo concentrado de ADN de doble cadena utilizando un fluorómetro, luego prepare una alícuota de 700 nanogramos de la muestra en un volumen final de 65 microlitros para proceder a la etapa de ligadura del adaptador y retener el resto de la piscina a cuatro grados centígrados para una segunda ejecución después de que finalice la primera ejecución. Continúe con la ligadura del adaptador de acuerdo con las instrucciones del fabricante. Para proceder con la secuenciación, mezcle los tampones de cebado y cebe la celda de flujo.
Prepare la solución de biblioteca de ADN y cargue la muestra en forma dropwise en el puerto de carga. Inicie la ejecución de secuenciación. Abra el software operativo para la secuenciación y haga clic en el botón de inicio, luego ingrese un nombre para el experimento.
Vaya a continuar con la selección del kit para seleccionar el kit de preparación de la biblioteca apropiado y el paquete de expansión de código de barras utilizado y luego haga clic en continuar ejecutando las opciones. Si planea preparar una biblioteca suficiente para una segunda ejecución, ajuste la duración de la ejecución de 72 horas predeterminadas a 48 horas y presione continuar con la llamada base. Marque la opción basecalling en config fast basecalling.
Establezca el código de barras en habilitado para que la salida FASTQ se recorte de las secuencias de códigos de barras y se desmuldicione en directorios separados basados en códigos de barras. Haga clic en continuar con la salida. A continuación, elija dónde guardar los datos de secuenciación de salida.
Espere aproximadamente de 30 a 50 gigabytes de datos si solo ahorra la salida FASTQ y más de 500 gigabytes de datos si guarda la salida FAST5. Si planea continuar con el filtrado manual después de la secuenciación, desmarque la opción de filtrado Qscore siete en longitud de lectura sin filtrar. De lo contrario, deje la opción marcada.
Vaya a continuar ejecutando la pestaña de configuración para revisar todas las configuraciones. Si la configuración es correcta, haga clic en el botón inicio. De lo contrario, haga clic en Atrás para realizar los ajustes necesarios.
En el directorio de lecturas largas, cree nuevos directorios para cada código de barras utilizado en la ejecución. Copie todos los archivos fastq que correspondan a cada código de barras en la carpeta correspondiente. Combine todos los archivos fastq para cada código de barras de cada ejecución.
Una vez que los archivos estén combinados, abra el terminal y navegue a los directorios de códigos de barras dentro del directorio de lecturas largas utilizando el comando cd. Para concatenar todos los archivos fastq por código de barras en un solo archivo fastq, ejecute el comando y repita el procedimiento para cada código de barras. Utilice NanoStat para evaluar la calidad de lectura del ejemplo ejecutando el comando y, a continuación, registre los resultados copiando el resultado en un archivo de texto o Word para futuras referencias.
Una vez guardados los resultados, utilice NanoFilt para filtrar las lecturas de MinION, descartando las lecturas con Q inferior a siete y la longitud inferior a 200 ejecutando el comando. En el archivo recortado generado, ejecute NanoStat con el comando. Registre los resultados copiando el resultado en un archivo de texto o Word y compárelos con los resultados anteriores para asegurarse de que el filtrado se realizó correctamente.
Repita los pasos para cada código de barras utilizado en la ejecución de secuenciación. Para generar el ensamblaje del genoma híbrido, organice los archivos de lectura corta y los archivos de lectura larga en un solo directorio denominado trimmed_reads. Por lo tanto, el directorio contiene un fastq generado previamente.
archivo gz para lecturas largas recortadas y dos fastq. gz archivos como R1 y R2 para lecturas cortas recortadas. Navegue hasta el directorio trimmed_reads que almacena los archivos de lectura utilizando el comando cd en terminal.
Una vez en el directorio correcto, comprima los dos archivos de lectura corta para almacenarlos en el fastq. gz formato ejecutando el comando. Repita el paso para R1 y R2. Asegúrese de que todos los archivos leídos estén en el fastq.
gz y verifique que todos los archivos coincidan con el mismo aislado. Comience el conjunto híbrido mediante Unicycler ejecutando el comando. Cuando se complete la ejecución, revise el monociclista.
log para garantizar que no haya errores. Registre el número, el tamaño y el estado completo o incompleto del contexto generado. Si se identifican contextos incompletos en el registro de Unicycler, vuelva a ejecutar Unicycler en negrita agregando el indicador al comando.
Abra Vendaje y haga clic en el archivo, luego elija cargar gráfico y seleccione el ensamblaje. El archivo gfa que se guardó anteriormente en el unicycler_output_directory generado por Unicycler. Una vez que se cargue el archivo, haga clic en el botón dibujar gráfico en la barra de herramientas de la izquierda y evalúe si el ensamblaje está completo examinando cómo se conectan y organizan los contigs.
Navegue dentro del terminal hasta la carpeta que almacena la salida del monociclizador mediante el comando cd. A continuación, ejecute el protocolo quast ejecutando el comando. Revise los informes generados por quast en el directorio de salida quast_output_directory.
Navegue dentro del terminal hasta la carpeta que almacena la salida del monociclizador mediante el comando cd y, a continuación, ejecute prokka ejecutando el comando. Revise las anotaciones abriendo la tabla tsv y cargando el archivo gff generado en el software de análisis de secuencia. Visualizar y analizar las anotaciones en el software.
En las imágenes representativas del gel, se representan los resultados de la extracción de ADN genómico o gDNA. Se puede observar una extracción y separación exitosas de gDNA intacto. También se representa la extracción fallida que muestra contaminación fragmentada de gDNA y ARN.
Los gráficos de ensamblaje del genoma de las bacterias fueron generados por uniciclizador híbrido de novo ensamblado y visualizados por Bandage. El genoma completo de Klebsiella oxytoca KoPF10 demostró un solo cromosoma cerrado y el genoma completo de Klebsiella pneumoniae KpPF25 consistió en un cromosoma cerrado y cinco plásmidos cerrados. El cromosoma incompleto de Klebsiella pneumoniae KpPF46 consistía en dos contigs interconectados.
Los mapas de ensamblaje generados por Geneious Prime para el genoma completo de Klebsiella oxytoca KoPF10 y Klebsiella pneumoniae KpPF25 muestran genes anotados denotados por flechas de colores a lo largo de las columnas vertebrales de plásmidos. Para garantizar que la carga de celdas de flujo sea correcta, filtre las lecturas largas utilizando la configuración recomendada y asegúrese de que todos los archivos estén en el fastq. formato gz.
Ejecute el comando Unicycler correcto utilizando archivos que pertenecen al mismo ejemplo.