Method Article
La secuenciación de nanoporos es una tecnología novedosa que permite una secuenciación rentable en ubicaciones remotas y entornos con escasos recursos. Aquí, presentamos un protocolo para la secuenciación de mRNAs de sangre entera que es compatible con tales condiciones.
La secuenciación en ubicaciones remotas y entornos con escasos recursos presenta desafíos únicos. La secuenciación de nanoporos se puede utilizar con éxito en esas condiciones y se desplegó en África occidental durante la reciente epidemia de virus del Ebola, destacando esta posibilidad. Además de sus ventajas prácticas (bajo costo, facilidad de transporte y uso de equipos), esta tecnología también proporciona ventajas fundamentales sobre los enfoques de secuenciación de segunda generación, en particular la longitud de lectura muy larga, la capacidad de secuenciar directamente ARN y disponibilidad de datos en tiempo real. La precisión de lectura RAW es menor que con otras plataformas de secuenciación, lo que representa la principal limitación de esta tecnología; sin embargo, esto se puede mitigar parcialmente por la alta profundidad de lectura generada. Aquí, presentamos un protocolo compatible con el campo para la secuenciación de la codificación mRNAs para Niemann-Pick C1, que es el receptor celular para Ebolavirus. Este protocolo abarca la extracción de ARN de muestras de sangre animal, seguida de RT-PCR para el enriquecimiento objetivo, código de barras, preparación de la biblioteca, y la secuencia de ejecución en sí, y se puede adaptar fácilmente para su uso con otros objetivos de ADN o ARN.
La secuenciación es una herramienta poderosa e importante en la investigación biológica y biomédica. Permite el análisis de genomas, variaciones genéticas y perfiles de expresión de ARN, y por lo tanto desempeña un papel importante en la investigación de enfermedades humanas y animales por igual1,2. La secuenciación de Sanger, uno de los métodos más antiguos disponibles para la secuenciación del ADN, todavía se utiliza rutinariamente hasta el día de hoy y ha sido una piedra angular de la biología molecular. En los últimos 50 años, esta tecnología se ha mejorado para lograr longitudes de lectura superiores a 1.000 NT y una precisión de hasta 99,999%1. Sin embargo, la secuenciación de Sanger también tiene limitaciones. Secuenciar un conjunto más grande de muestras o el análisis de genomas enteros con este método consume mucho tiempo y es costoso1,3. Los métodos de secuenciación de ADN de segunda generación (de próxima generación), como la pirosecuenciación 454 y la tecnología Illumina, nos han permitido reducir significativamente el costo y la carga de trabajo requeridos para la secuenciación en la última década, y han conducido a un tremendo aumento en el cantidad de información de la secuencia biológica disponible4. Sin embargo, las ejecuciones de secuenciación individuales utilizando estas tecnologías de segunda generación son costosas, y la secuenciación en condiciones de campo es desafiante, ya que el equipo necesario es voluminoso y frágil (similar a los dispositivos de secuenciación de Sanger), y a menudo tiene que ser calibrados y atendidos por personal especialmente capacitado. Además, para muchas de las tecnologías de segunda generación las longitudes de lectura son bastante limitadas, lo que a menudo hace que el análisis Bioinformático posterior de estos datos sea un desafío.
La secuenciación de tercera generación que utiliza dispositivos de secuenciación de nanoporos de tamaño de bolsillo (consulte la tabla de materiales) puede servir como una alternativa a estas plataformas de secuenciación establecidas. En estos dispositivos, una molécula de ADN o ARN de una sola cadena pasa a través de un nanoporo simultáneamente con una corriente iónica que luego es medida por un sensor (figura 1). A medida que la hebra atraviesa el nanoporo, se detecta la modulación de la corriente por los nucleótidos presentes en el poro en un momento dado, y se traduce de forma computacional hacia atrás en la secuencia de nucleótidos5. Debido a este principio operacional, la secuenciación de nanoporos permite tanto la generación de lecturas muy largas (cerca de 1 x 106 nucleótidos6) como el análisis de datos de secuenciación en tiempo real. El código de barras es posible adjuntando secuencias de nucleótidos definidas a los ácidos nucleicos de una muestra, lo que permite el análisis de múltiples muestras en una sola ejecución de secuenciación, aumentando así el rendimiento de la muestra y reduciendo los costos de muestra. Debido a su alta portabilidad y facilidad de uso, los dispositivos de secuenciación de nanoporos se han utilizado con éxito en el campo durante la reciente epidemia de enfermedad por el virus del Ebola en África occidental, destacando su idoneidad para un rápido despliegue en regiones remotas7 , 8.
Aquí describimos un protocolo detallado de campo compatible para la secuenciación de la codificación de mRNA para la proteína Niemann-Pick C1 (NPC1), que es el receptor de entrada obligado para filovirus como los Ebolavirus, y se ha demostrado que limita la susceptibilidad de las especies a estos virus9,10. El protocolo abarca la extracción de ARN entero a partir de muestras de sangre, la amplificación específica de NPC1 mRNA por RT-PCR, código de barras de muestras, preparación de la biblioteca y secuenciación con un dispositivo de secuenciación de nanoporos. El análisis de datos no puede discutirse debido a limitaciones de espacio, aunque se proporcionan algunas orientaciones básicas en los resultados representativos; sin embargo, el lector interesado se refiere a una publicación anterior11 para una descripción más detallada del flujo de trabajo que usamos, así como a publicaciones deotros 12,13,14 para obtener información detallada sobre las herramientas de análisis utilizadas en este flujo de trabajo.
Las muestras fueron recogidas siguiendo el protocolo de la Junta de revisión institucional de la Universidad de Njala (NUIRB). IRB00008861/FWA00018924.
1. extracción de ARN de muestras de sangre
2. transcripción inversa de NPC1 mRNA en cDNA
3. amplificación del marco de lectura abierto NPC1
4. código de barras de NPC1 amplicons
5. preparación de la biblioteca
6. control de calidad de la célula de flujo
7. cargando la celda de flujo e iniciando la ejecución de secuenciación
En un experimento representativo para probar el protocolo presentado, extraemos el ARN de 10 muestras de sangre diferentes de cinco especies animales (es decir, 2 individuos por especie (cabra, oveja, porcino, perro, ganado)) (tabla 3). El rendimiento de ARN y la calidad después de la extracción pueden variar ampliamente, en particular debido a las diferencias en el manejo y almacenamiento de muestras. En nuestro experimento representativo, observamos concentraciones de ARN entre 43 ng y 543 ng por μL (tabla 3). También, después de la amplificación por RT-PCR, análisis de gel de la NPC-1 PCR-Productos mostraron varios resultados (figura 2), con bandas notablemente más débiles para las muestras BC01 y BC02 (ambos cabra). Estas diferencias fueron probablemente causadas por diferencias en la calidad de la muestra, aunque no se pueden excluir las diferencias en la eficacia de PCR debido a las diferencias en la Unión de imprimación al gen NPC1 de diferentes especies. Sin embargo, estas diferencias en la eficiencia de rendimiento y/o amplificación no impactan marcadamente el resultado general de la secuenciación. Además, se produjo un producto adicional no específico de PCR en la muestra BC10 (bovinos). A diferencia de la secuenciación de Sanger, estos productos no específicos no influyen negativamente en los resultados de la secuenciación de nanoporos, ya que estas lecturas se descartan durante el mapeo de las lecturas obtenidas a una secuencia de referencia como parte del análisis de datos.
Antes de cada ejecución de secuenciación, se recomienda encarecidamente una comprobación de calidad de la célula de flujo que se va a utilizar, con un requisito mínimo de 800 poros totales. En nuestro experimento representativo, este cheque de calidad devolvió 1.102 poros disponibles para la secuenciación. Dado que los datos se proporcionan en tiempo real y se pueden analizar inmediatamente, la duración de una ejecución de secuenciación se puede ajustar para la aplicación individual (es decir, hasta que se produzcan suficientes datos de secuenciación para el análisis deseado). En nuestros experimentos, las ejecuciones de secuenciación normalmente se realizan durante la noche, y en el caso de nuestro experimento representativo hemos obtenido aproximadamente 1,4 millones lecturas durante una carrera de 14 h.
Dependiendo del tipo de análisis de datos a realizar, puede ser aconsejable procesar sólo un subconjunto de las lecturas obtenidas. En el caso de nuestro experimento representativo, se seleccionó un subconjunto de 10.000 lecturas para su posterior análisis. Con este fin, los archivos fastq generados durante la ejecución de secuenciación fueron procesados en un entorno Ubuntu 18,04 LTS, y demultiplexado usando FlexBar v 3.0.3 con parámetros optimizados para demultiplexación de datos de secuenciación de nanoporos (código de barras-longitud de cola 300 , código de barras-Error-Rate 0,2, código de barras-brecha-1)12. Después de la demultiplexación, el mapeo de lectura y la generación de consenso se pueden hacer usando una serie de herramientas diferentes, pero una discusión detallada del aspecto Bioinformático de la secuenciación de nanoporos va más allá del alcance de este manuscrito. Sin embargo, en el caso de nuestros resultados representativos, el mapeo de lectura a una secuencia de referencia se realizó usando Geneious 10.2.3. De las 10.000 lecturas analizadas, 5.457 mostraron una longitud entre 1.750 y 2.000 nucleótidos, que coincide con los tamaños esperados para los fragmentos de PCR amplificados como parte de nuestro flujo de trabajo (1.769 NT, figura 3). Se observó un pico adicional en la distribución de la longitud de las lecturas entre 250 y 500 nucleótidos, que pueden atribuirse a productos de PCR no específicos. La demultiplexación de lecturas permitió la asignación del 87,6% de las lecturas a uno de los 10 códigos de barras/muestras analizadas (figura 4). La proporción de lecturas demultiplexadas para cada código de barras osciló entre el 3,4% para el código de barras 1 al 16,9% para el código de barras 10; sin embargo, debido al gran número total de lecturas, esto todavía permitía un consenso significativo con una alta profundidad de lectura incluso para estos datasets de código de barras de menor abundancia. De hecho, el mapeo de las lecturas ordenadas a una secuencia de referencia de NPC1 dio como resultado entre 31,7% (código de barras 2) y 100% (código de barras 7 y 8) de lecturas de mapeo a la referencia, dando una profundidad de lectura de más de 90 lecturas en cualquier posición para cada muestra. Esto es más que suficiente para permitir una llamada base de consenso segura con una tasa de error insignificante.
Figura 1: representación esquemática de la secuenciación de ADN utilizando tecnología de nanoporos. Una molécula de ADN de una sola cadena pasa a través de un nanoporo incrustado en una membrana resistente eléctricamente, con una helicasa que regula la velocidad de transición. Una corriente iónica pasa simultáneamente a través del poro y se mide continuamente. Las modulaciones de la corriente causadas por los nucleótidos presentes en el poro se detectan y se traducen de forma computacional a la secuencia nucleotídica de la hebra de ADN. Por favor, haga clic aquí para ver una versión más grande de esta figura.
Figura 2: amplificación de productos de PCR de Niemann-Pick C1 de mRNA. el mRNA fue aislado de cabra (BC01 y 02), ovejas (BC03 y 04), cerdos (BC05 y 06), perros (BC07 y 08), y bovinos (BC09 y 10). Los productos de PCR anidados fueron separados en un 0,8% gel de agarosa en 1x TAE buffer (preparado a partir de 50X TAE buffer: 242,28 g de Tris base, 57,1 mL de ácido acético glacial, 100 mL de 0,5 M EDTA, dH2O a 1 L, pH ajustado a 8,0) para 45 min a 100 V y manchado con SYBR Safe. Por favor, haga clic aquí para ver una versión más grande de esta figura.
Figura 3: distribución de la longitud de lectura de 10.000 lecturas del experimento representativo. Se indica el número de lecturas obtenidas con un intervalo de longitud de lectura determinado. Por favor, haga clic aquí para ver una versión más grande de esta figura.
Figura 4: distribución de lecturas tras demultiplexación. Se muestra el número y el porcentaje de lecturas desmultiplexadas (grises) y mapeadas (negras) para cada código de barras. Por favor, haga clic aquí para ver una versión más grande de esta figura.
Tabla 1: Resumen de los sets de imprimación utilizados. La amplificación inicial de las secuencias de destino se realizó con primer set 1. El primer set 2 fue entonces utilizado para la amplificación anidada y la adición del adaptador. Los adaptadores se indican en rojo. Por favor haga clic aquí para descargar este archivo.
Tabla 2: Resumen de las secuencias de códigos de barras. Se utilizaron códigos de barras individuales para identificar cada muestra secuenciada. Por favor haga clic aquí para descargar este archivo.
Tabla 3: concentraciones de ARN obtenidas tras la extracción de muestras de sangre secuenciadas en el experimento representativo. Se muestran las concentraciones de ARN de dos individuos de cada una de las cinco especies, y se indican las proporciones de las densidades ópticas a 260/280 nm y 260/230 Nm. Por favor haga clic aquí para descargar este archivo.
En las últimas dos décadas, la secuenciación de muestras biológicas se ha convertido en un aspecto cada vez más importante de los estudios en una amplia gama de áreas temáticas. El desarrollo de sistemas de secuenciación de segunda generación basados en la secuenciación de una densa gama de características de ADN utilizando ciclos iterativos de manipulación enzimática y adquisición de datos basada en imágenes1 ha aumentado drásticamente el rendimiento en comparación con el técnica tradicional de secuenciación de Sanger, y permite el análisis de múltiples muestras, así como diversas especies de ácidos nucleicos en una muestra dada en paralelo4. Sin embargo, para la mayoría de los sistemas de segunda generación de uso común, sólo se producen lecturas cortas, y todas las plataformas dependen de equipos sensibles, voluminosos y caros3,4.
A diferencia de las plataformas de secuenciación de segunda generación, el dispositivo de secuenciación utilizado en este protocolo se basa en la tecnología de nanoporos. Aquí, una molécula de ácido nucleico de una sola cadena pasa a través de un nanoporo, lo que resulta en la modulación de una corriente iónica que también fluye a través del mismo nanoporo, y que se puede medir y volver a traducir para inferir la secuencia de la molécula de ácido nucleico. Este enfoque de secuenciación de tercera generación imparte una serie de ventajas sobre otros enfoques. Las principales ventajas que están directamente relacionadas con el principio de funcionamiento único de esta tecnología son la longitud de lectura extremadamente larga producida (se han reportado longitudes de lectura de hasta 8,8 x 105 nucleótidos6), la capacidad de secuenciar no sólo el ADN sino también ARN directamente, que se demostró recientemente para un genoma completo del virus de la gripe17, y la capacidad de analizar datos en tiempo real a medida que se generan, lo que permite la detección rápida metagenómica de patógenos en cuestión de minutos18. Las ventajas prácticas adicionales son el tamaño extremadamente pequeño del dispositivo de secuenciación de nanoporos, lo que permite su uso en cualquier laboratorio o en misiones de campo a ubicaciones remotas19,20y el bajo precio en comparación con otras secuencias Plataformas. En cuanto a los costes de ejecución, actualmente se requiere una nueva célula de flujo para cada ejecución de secuenciación, lo que da como resultado unos costes de aproximadamente $1.100 por ejecución para la célula de flujo y los reactivos de preparación de biblioteca. Estos costes pueden reducirse en algunos casos lavando y reutilizando la célula de flujo, o codificando y secuenciando varias muestras en una sola ejecución. También, un nuevo tipo de célula de flujo está siendo probado beta por un pequeño número de laboratorios, que requerirá el uso de un adaptador de célula de flujo (llamado un "flongle"), y debe reducir significativamente el precio de la célula de flujo y por lo tanto los costos de funcionamiento.
La mayor deficiencia de la secuenciación de nanoporos sigue siendo su precisión, con precisiones de lectura únicas en el rango de 83 a 86% que se notifican6,21,22, y la mayoría de las inexactitudes causadas por la inserción/deleciones ( InDels)5,21. Sin embargo, una alta profundidad de lectura puede compensar estas inexactitudes, y un estudio reciente sugerido basado en consideraciones teóricas que una profundidad de lectura de > 10 podría aumentar la precisión general a > 99,8%21. Sin embargo, se necesitarán mejoras adicionales en la precisión, especialmente si el análisis debe realizarse en un nivel de molécula única en lugar de en un nivel de secuencia de consenso. El uso de la tecnología 1D2 como se describe en este protocolo, que se basa en la adición de los adaptadores 1D2 y códigos de barras (cf. sección 5,5) que dan lugar a que ambas hebras de una sola molécula de ADN sean secuenciadas por el mismo nanoporo, aumenta la lectura precisión, ya que la información de ambas hebras de ADN puede utilizarse para la determinación de secuencia. Además, una estrategia de solución alternativa que se puede perseguir para combinar las ventajas de la secuenciación de nanoporos (especialmente larga longitud de lectura) con la mayor precisión de otras tecnologías de secuenciación es utilizar la información de secuenciación de nanoporos como un andamio, que es luego pulidas usando datos de secuenciación de otras plataformas6.
El factor más crítico para el éxito del protocolo presentado aquí es la calidad de la muestra, y en particular la cantidad y la calidad del ARN extraído. El almacenamiento adecuado y la extracción rápida del ARN ayudan a lograr un rendimiento de ARN adecuado. El uso de tubos de recolección de sangre apropiados permite el almacenamiento de muestras de sangre por hasta un mes, pero la coagulación de la sangre puede ser un problema, especialmente cuando las muestras se almacenan a temperaturas elevadas, que puede ser el caso en condiciones de campo. El segundo paso crítico es la amplificación de las secuencias de destino, y en particular en condiciones de campo las reacciones de PCR a menudo funcionan menos bien que en condiciones de laboratorio estándar7. Con este fin, el diseño y la optimización de imprimación cuidadosa es primordial para lograr una amplificación robusta. Además, los enfoques de PCR anidados y la PCR de touchdown, tal como se utilizan en este protocolo, pueden aumentar tanto la especificidad como la sensibilidad de la amplificación del gen objetivo4,7. De hecho, en nuestra experiencia en Liberia y Guinea con esta tecnología se requerían protocolos anidados en condiciones de campo con muestras de campo, incluso para los sets de imprimación que permitían la amplificación de objetivos a partir de muestras de laboratorio y en condiciones de laboratorio con una única ronda de PCR (7 y resultados inéditos).
En contraste con estos pasos más críticos, la preparación de la biblioteca y la ejecución de secuenciación en sí son procedimientos bastante robustos. Sin embargo, en condiciones de campo, las cuestiones prácticas, como la disponibilidad de ciertas piezas de equipo, pueden ser problemáticas. Por ejemplo, se necesita un espectrofotómetro UV para determinar las concentraciones de ADN antes de la preparación de la biblioteca de muestras con código de barras. Sin embargo, en caso de que este dispositivo no esté disponible en condiciones de campo, un volumen igual de cada muestra puede combinarse simplemente para formar los 45 μL requeridos para la preparación de la biblioteca, con diferencias en el material de entrada de la muestra, que generalmente se mitiga por el gran número de lecturas. Del mismo modo, la necesidad de conectividad a Internet para la ejecución de secuenciación puede ser un problema, aunque la llamada base ya no tenga que realizarse en línea, pero se puede realizar localmente; sin embargo, esta necesidad se puede eliminar en determinadas circunstancias por el fabricante, si es necesario.
En Resumen, el protocolo presentado permite una secuenciación relativamente de bajo costo en ubicaciones sin acceso a equipos de secuenciación tradicionales, incluso en ubicaciones remotas. Se puede adaptar fácilmente a cualquier ARN o ADN objetivo, lo que permite a los investigadores responder a numerosas preguntas biológicas.
TH participó en el programa de acceso anticipado Oxford Nanopore Technologies (ONT) MinION de 2014 a 2015, y recibió dispositivos MinION y células de flujo para un estudio anterior 7 realizado por los institutos nacionales de la salud, EE.UU., de forma gratuita o a costos reducidos . Fue invitado por ONT para presentar parte de ese trabajo en el London Calling 2015 reunión en Londres, Reino Unido, y ONT pagado para el transporte y alojamiento. Para el trabajo presentado en este manuscrito, no se obtuvieron beneficios (por ejemplo, hardware o reactivos a un costo reducido, reembolsos de viajes, etc.) de ONT. AM, KF y RS no tienen nada que revelar.
Los autores agradecen a Allison Groseth la lectura crítica del manuscrito. Este trabajo fue apoyado financieramente por el Ministerio Federal alemán de alimentación y agricultura (BMEL) basado en una decisión del Parlamento de la República Federal de Alemania a través de la Oficina Federal de agricultura y alimentación (BLE).
Name | Company | Catalog Number | Comments |
1D2 adapter, barcode adapter mix, ABB buffer, elution buffer, RBF buffer, LBB beads | Oxford Nanopore Technologies | SQK-LSK308 | 1D² Sequencing Kit |
Blood collection tube with DNA/RNA stabilizing reagent | Zymo Research | R1150 | DNA/RNA Shield - Blood Collection Tube |
Blunt/TA ligase master mix | New England Biolabs | M0367S | Blunt/TA Ligase Master Mix |
DNA-low binding reaction tube | Eppendorf | 30108051 | DNA LoBind Tube |
DNase buffer and DNase | ThermoFisher Scientific | 11766050 | SuperScript™ IV VILO™ Master Mix with ezDNase™ Enzyme |
Flow cell | Oxford Nanopore Technologies | FLO-MIN105.24 | flow cell R9.4 |
Hot start high fidelity DNA polymerase | New England Biolabs | M0493L | Q5 Hot Start High-Fidelity DNA Polymerase (500 U) |
Magnetic beads | Beckman Coulter | A63881 | Agencourt AMPure XP beads |
Magnetic rack | ThermoFisher Scientific | 12321D | DynaMag-2 Magnet |
Nanopore sequencing device | Oxford Nanopore Technologies | - | MinION Mk 1B |
PCR barcoding kit | Oxford Nanopore Technologies | EXP-PBC001 | PCR Barcoding Kit I (R9) |
Reverse transcriptase master mix | ThermoFisher Scientific | 11766050 | SuperScript™ IV VILO™ Master Mix with ezDNase™ Enzyme |
RNA purification spin column, DNA/RNA prep buffer, DNA/RNA wash buffer, DNase I, DNA digestion buffer | Zymo Research | R1151 | Quick-DNA/RNA Blood Tube Kit |
Rotating mixer | ThermoFisher Scientific | 15920D | HulaMixer Sample Mixer |
Taq DNA polymerase | New England Biolabs | M0287S | LongAmp Taq 2x Master Mix |
Ultra II End-prep kit | New England Biolabs | E7546S | NEBNext Ultra II End-Repair/dA-tailing Modul |
UV spectrophotometer | Implen | - | NanoPhotometer |
Vacuum manifold | Zymo Research | S7000 | EZ-Vac Vacuum Manifold |
Solicitar permiso para reutilizar el texto o las figuras de este JoVE artículos
Solicitar permisoThis article has been published
Video Coming Soon
ACERCA DE JoVE
Copyright © 2025 MyJoVE Corporation. Todos los derechos reservados