Secuencias de largo leer facilitan enormemente el montaje de genomas complejos y la caracterización de la variación estructural. Se describe un método para generar secuencias muy largas por plataformas de secuenciación basada en nanopore. El enfoque adopta una extracción de ADN optimizada seguida por las preparaciones de la biblioteca modificada para generar cientos de kilobases Lee con una cobertura moderada de células humanas.
Tercera generación de tecnologías de secuenciación de ADN de una sola molécula ofrecen significativamente más Lee longitud que puede facilitar el ensamblaje de complejos genomas y análisis de variantes estructurales complejas. Plataformas Nanopore realizan secuenciación de una sola molécula por medición directa de los cambios actuales mediados por el paso de ADN a través de los poros y pueden generar cientos de kilobases (kb) dice con mínimo costo de capital. Esta plataforma ha sido adoptada por muchos investigadores para una variedad de aplicaciones. Lograr más largos de lectura de la secuencia es el factor más crítico para aprovechar el valor de las plataformas de secuenciación nanopore. Para generar lecturas ultra-larga, consideración especial es necesaria para evitar roturas de DNA y ganar eficiencia para generar plantillas de secuencia productiva. Presentamos el protocolo detallado de ultra larga secuencia de la DNA incluyendo la extracción de ADN de alto peso molecular (APM) de las células frescas o congeladas, construcción de biblioteca por corte mecánico o fragmentación de la transposasa y la secuencia en un dispositivo nanopore. De 20-25 μg de ADN de HMW, el método puede alcanzar N50 leer longitud de 50-70 kb con el corte mecánico y N50 de 90-100 kb leer longitud con transposasa mediada fragmentación. El protocolo se puede aplicar al ADN extraído de células de mamíferos para realizar la secuenciación del genoma entero para la detección de variantes estructurales y ensamblaje del genoma. Mejoras adicionales sobre la extracción de ADN y las reacciones enzimáticas más aumentará la longitud leer y ampliar su utilidad.
En la última década, masivamente paralelo y tecnologías de secuenciación de alto rendimiento segunda generación altamente exacto han llevado a una explosión de descubrimientos biomédicos e innovación tecnológica1,2,3. A pesar de los avances técnicos, el corto-leer datos generados por las plataformas de segunda generación son eficaces en la resolución de regiones genómicas complejas y están limitados en la detección de variantes estructurales genómicas (SVs), que desempeñan papeles importantes en humanos evolución y enfermedades4,5. Además, corto-leer datos no puede resolver variación repetición y son inadecuados para los más exigentes haplotipo eliminación de variantes genéticas6.
Últimos avances en secuenciación de una sola molécula ofrece mucho más leer longitud, que puede facilitar la detección de la gama completa de SVs7,8,9y ofrece montaje precisa y completa del complejo genomas microbianos y mamíferos6,10. La plataforma nanopore realiza la secuenciación de una sola molécula por medición directa de los cambios actuales mediados por el paso de ADN a través de los poros11,12,13. A diferencia de cualquier química existente de secuenciación de ADN, secuenciación nanopore puede generar largos (decenas o miles de kilobases) lecturas en tiempo real sin depender de la cinética de la polimerasa o artificial la amplificación de la muestra de ADN. Por lo tanto, nanopore larga lectura secuencia (NLR-seq) tiene gran promesa para la generación de ultra largos leerlas más allá de 100 kb, lo que adelantaría mucho análisis genómico y biomédica14, particularmente en la repetición-ricas o baja complejidad regiones del genoma15.
La característica única de la secuencia nanopore es su potencial para generar largas lee sin una limitación de la longitud teórica. Por lo tanto, la longitud leer depende de la longitud física de la DNA que es afectada directamente por la calidad de plantilla de integridad y secuenciación de ADN. Por otra parte, dependiendo del grado de manipulación y el número de pasos implicados, como el pipeteo de las fuerzas y condiciones de extracción, la calidad de la DNA es muy variable. Por lo tanto, es un reto para uno para lecturas largas aplicando sólo los protocolos de extracción de ADN estándar y métodos de construcción de biblioteca suministrado del fabricante. Con este fin, hemos desarrollado un sólido método para generar muy largo leer (cientos de kilobases) datos de la secuencia a partir de gránulos de células cosechadas. Adoptaron múltiples mejoras en los procedimientos de preparación de extracción y biblioteca de ADN. Optimizamos el protocolo para excluir procedimientos innecesarios que causan daños y degradación del ADN. Este protocolo está compuesto de alto peso molecular (HMW) extracción de ADN, ultra larga construcción de biblioteca de ADN y la secuencia en una plataforma nanopore. Para un biólogo molecular bien entrenado, normalmente tarda 6 h desde la cosecha hasta la finalización de la extracción de ADN de HMW, 90 minutos o 8 h para la construcción de la biblioteca según el método de corte y hasta un más 48 h para la secuencia de la DNA de la célula. El uso del Protocolo será empoderar a la comunidad genómica para mejorar nuestra comprensión de la complejidad del genoma y conocer nueva variación del genoma en enfermedades humanas.
Nota: El protocolo de NLR-seq consta de tres pasos consecutivos: 1) extracción de peso molecular alto peso (HMW) ADN genómico; 2) ultra largo DNA biblioteca de la construcción, que incluye la fragmentación del ADN de HMW en los tamaños deseados y la ligadura de adaptadores de secuenciación del ADN termina; y 3) carga de la DNA adaptador de ligarse a los arreglos de discos de interconectivos (figura 1).
1. extracción de ADN de HMW
2. Ultra largo DNA biblioteca de la construcción
Nota: Hay dos formas de construir las bibliotecas de ADN muy largas basadas en dos métodos diferentes de corte juntados con kits de secuenciación nanopore. Una biblioteca de base de esquila mecánica produce datos con una N50 de 50-70 kb, teniendo alrededor de 8 h para la construcción de la biblioteca. Una biblioteca basada en la fragmentación de la transposasa produce una N50 de 90-100 kb de datos, tomando sólo 90 min para la construcción de la biblioteca. El protocolo de corte mecánico da mayor rendimiento desde el mismo ADN de entrada utilizar versiones idénticas de adaptador de la secuencia y calidad de las células de flujo nanopore.
3. la secuencia en el dispositivo nanopore
El protocolo de secuenciación de ADN ultra largo aplica APM ADN para la construcción de la biblioteca. Por lo tanto, es fundamental elegir bien cultivos de células con el cociente directo > 85% en la celda de recolección paso. La cantidad de células utilizadas para la extracción de ADN afecta la calidad y la cantidad de ADN de HMW. La lisis celular no funciona bien si a partir de muchas células. Con muy pocas células no genera suficiente ADN para la construcción de la biblioteca porque la precipitación de ADN de HMW se realiza mediante rotación suave a mano en lugar de centrifugación de alta velocidad. Un ejemplo del ADN de HMW después agregar helado 100% de etanol y de rotación se muestran como el precipitado blanco de algodón-como en la figura 2.
Es importante comprobar la calidad de la entrada de ADN antes de comenzar la construcción de la biblioteca. Degradación, cuantificación incorrecta, contaminación (p. ej., proteínas, ARN, detergentes, surfactante y fenol residual o etanol) y ADN de bajo peso molecular pueden tener un efecto significativo sobre los procedimientos posteriores y sobre el final leer longitud. Se recomienda realizar el análisis de control de calidad utilizando el ADN de tres lugares diferentes en el tubo que contiene el ADN de HMW. De lectura de los resultados de los ADN de HMW de Ultravioleta, el OD260/do280 valor es aproximadamente 1,9 y el OD260/do230 valor es aproximadamente 2.3 (Figura 3AB). Estos valores de relación son consistentes entre las tres pruebas de una buena muestra de ADN de HMW. Diferentes métodos de corte requiere diferentes volúmenes de DNA entrada. La concentración de ADN de HMW debe ser > 200 ng/μL para mecánico de corte mientras que debe ser > 1 μg/μl de fragmentación de la transposasa. La concentración detectada por un Fluorímetro es un poco menor que UV leyendo. Sin embargo, el coeficiente de variación de la concentración de la misma muestra de ADN de HMW debe ser inferior al 15% con el fluorómetro y la UV leer ensayos. Esquila mecánica, aplica una jeringa con una aguja para romper el ADN de HMW lo que el número de pasadas a través de la aguja tendrá un impacto del tamaño de ADN esquilado y la final Lee longitud. Se recomienda realizar tamaño del control de calidad después de aguja de corte para asegurar la mayoría de los ADN de HMW es mayor que 50 kb como se ilustra en la figura 4. En el método de esquila mecánico, 30 pasadas generan los mejores resultados de la secuencia teniendo en cuenta la longitud y la salida.
N50 de una biblioteca de base de esquila mecánica es de 50-70 kb mientras que una biblioteca basada en la fragmentación de la transposasa es 90-100 kb. Los resultados de cuatro carreras utilizando la línea celular de HG00733 se muestran en la tabla 1. Todas las ejecuciones de cuatro tienen más de 2.300 lecturas con longitud superior a 100 kb. La longitud máxima es mayor en la transposasa fragmentación basado en bibliotecas (455 kb y 489 kb) en comparación con las bibliotecas de base de corte mecánicas (348 kb y 387 kb) mientras que estos últimos producen más lecturas total, indicando un rendimiento superior. La construcción de biblioteca basada en la fragmentación de la transposasa tiene menos pasos y menor tiempo de preparación para que presentará menos fragmentos cortos. Las dos carreras con la transposasa tienen una mayor longitud media (> 30 kb) y de longitud mediana (> 10 kb). Además, los datos demuestran alta calidad constante en todas las ejecuciones (puntuación de calidad media es aproximadamente 10.0, ~ 90% de precisión base). Más del 97% de total de bases fueron alineado con el genoma humano de referencia (hg19) usando Minimap216 con la configuración predeterminada. Las distribuciones de tamaño esperado de la materia prima Lee se muestran en la figura 5. Todas las ejecuciones tienen una gran proporción de datos por encima de 50 kb mientras que transposasa basado en la fragmentación de las bibliotecas tienen un cociente más alto de Lee muy largo (por ejemplo de > 100 kb). Este protocolo se ha aplicado con éxito en múltiples líneas celulares humanas (complementario tabla 1).
Figura 1: Descripción esquemática del flujo de trabajo de la secuencia larga de leer (NLR-seq) nanopore. Naranja, la transposasa complejo. Amarillo-verde, el adaptador nanopore. Haga clic aquí para ver una versión más grande de esta figura.
Figura 2: precipitación de ADN representativas de método de extracción de fenol-cloroformo. La flecha blanca indica el ADN de HMW. Haga clic aquí para ver una versión más grande de esta figura.
Figura 3: resultados del ejemplo del control de calidad del ADN de HMW de lectura UV. ADN de HMW (A) de paso 1.21.1 listo para construcción de biblioteca basado en el corte mecánico. ADN de HMW (B) de paso 1.21.2 para construcción de biblioteca basada en la fragmentación transposasa. Haga clic aquí para ver una versión más grande de esta figura.
Figura 4: resultados del control de calidad de la aguja esquilan HMW ADN por electroforesis del gel del pulsar-campo. L1: Rápido-carga escalera de DNA de 1 kb; L2: Rápido-carga 1 kb ampliar la escalera de ADN. 1-8: ADN con tiempos de paso diferentes a través de la aguja de corte. 1-3, ninguna corte; 4, 10 veces; 5, 20 veces; 6, 30 veces; 7, 40 veces; 8, 50 veces. Este paso de control de calidad es opcional. Haga clic aquí para ver una versión más grande de esta figura.
Figura 5: espera que las distribuciones de tamaño de las bibliotecas de ADN ultra-larga nanopore. MS, bibliotecas de base de corte mecánicas. TF, transposasa bibliotecas basado en la fragmentación. Haga clic aquí para ver una versión más grande de esta figura.
Shearing_rep1 mecánica | Shearing_rep2 mecánica | Transposasa fragmentation_rep1 | Transposasa fragmentation_rep2 | |
Línea celular | HG00733 | HG00733 | HG00733 | HG00733 |
N50 de Lee | 55.180 | 63.007 | 98.237 | 95.629 |
Número de lecturas de más de 100 Kb | 2.500 | 3.082 | 2.386 | 2.355 |
Número de lecturas total | 97.859 | 80.465 | 24.166 | 21.032 |
Longitud máxima (bp) | 348.482 | 387.113 | 454.660 | 489.426 |
Longitud media (bp) | 17.861 | 20.395 | 33.528 | 38.175 |
Longitud media (bp) | 5.335 | 5.894 | 10.249 | 15.656 |
Calidad media de las lecturas | 10.0 | 10.1 | 9.9 | 10.0 |
Total de bases de la materia prima Lee | 1,747,849,822 | 1,641,058,932 | 810,229,733 | 802,886,304 |
Total de bases de Lee alineada | 1,693,300,832 | 1,607,975,925 | 791,422,077 | 778,417,627 |
Proporción asignada de total de bases (hg19, Minimap2) | 96.9% | 98.0% | 97.7% | 97.0% |
Número de poros activos | 1225: 480, 402, 254, 89 | 1058: 480, 176, 356, 46 | 958: 452, 328, 148, 30 | 1092: 487, 367, 195, 43 |
Tabla 1: Resumen de indicadores de rendimiento funciona con diferentes protocolos de corte.
Biblioteca 1 | Biblioteca 2 | |
Línea celular | K562 | GM19240 |
Información de la célula | ATCC, cat. lol CCL-243 | Instituto Coriell, cat. lol GM19240 |
Protocolo | esquila mecánica | esquila mecánica |
N50 de Lee | 60.063 | 55.295 |
Número de lecturas total | 193.783 | 120.807 |
Longitud media (bp) | 1.843 | 4.688 |
Longitud media (bp) | 9.825 | 17.408 |
Longitud máxima (bp) | 548.780 | 212.338 |
Total de bases de la materia prima Lee | 1,903,989,686 | 2,103,015,331 |
Total de bases de Lee alineada | 1,837,350,047 | 1,997,419,761 |
Proporción asignada de total de bases (hg19, Minimap2) | 96,6% | 95.0% |
Número de poros activos | 1111: 482, 371, 203, 55 | 1032: 447, 333, 196, 56 |
Complementario tabla 1: Resumen de dos carreras de NLR-seq con otras líneas celulares con el protocolo de corte mecánico.
En principio, la secuencia nanopore es capaz de generar 100 kb a megabase lee en longitud11,12,13. Cuatro principales factores afectarán el desempeño de la calidad de ejecución y los datos de la secuencia: 1) activo poro números y la actividad de los poros; 2) proteína motor, que controla la velocidad de ADN pasando por nanopore; 3) plantilla ADN (longitud, pureza, calidad, total); 4) secuencia adaptador ligadura eficiencia, que determina el ADN utilizable de la muestra de entrada. Los dos primeros factores dependen de la versión de la célula de flujo y el kit de secuenciación proporcionado por el fabricante. El segundo dos factores son pasos críticos en este protocolo (extracción de ADN de HMW, corte y ligadura).
Este protocolo requiere paciencia y práctica. La calidad del ADN de HMW es importante ultra-larga de bibliotecas de ADN6. El protocolo comienza con las células con alta viabilidad (> 85% de células viables preferido), limitando el ADN degradado de las células muertas. Debe evitarse cualquier proceso áspero que puede presentar daños a la DNA (por ejemplo, fuerte inquietante, sacudiendo, vortex, múltiples pipeteo, repetida congelación y descongelación). En el diseño del Protocolo, omitimos el pipeteo en todo el proceso de extracción de ADN. Consejos de gran diámetro deben usarse cuando el pipeteo es necesario después de la esquila mecánica durante la construcción de la biblioteca y la secuencia. Como el interconectivos son sensibles a los químicos en la cámara buffer12, debe haber contaminantes residuales como pocos (p. ej., detergentes, tensioactivos, fenol, etanol, proteínas ARN, etc.) como sea posible en la DNA. Teniendo en cuenta la longitud y el rendimiento, el método de extracción de fenol muestra los resultados mejores y más reproducibles en comparación con varios diferentes métodos de extracción probados hasta ahora.
A pesar de la capacidad de este protocolo para producir secuencias de lectura larga, varias limitaciones siguen. En primer lugar, este protocolo fue optimizada basada en el dispositivo de secuencia nanopore disponible en el momento de su publicación; por lo tanto, se limita a la química de secuenciación selectiva basada en nanopore y podría ser subóptima cuando se realiza en otros tipos de dispositivos de lectura larga secuencia. En segundo lugar, el resultado es altamente dependiente de la calidad del ADN extraído de material de partida (tejidos o las células). Longitud de lectura podría deteriorarse si el ADN partido ya está degradado o dañado. En tercer lugar, aunque varios pasos de control de calidad están incorporados en el protocolo para comprobar la calidad del ADN, el rendimiento final y la longitud de las lecturas pueden verse afectadas por la celda de flujo y poro actividad, que puede ser variable en esta primera etapa de la plataforma de secuenciación nanopore desarrollo.
El protocolo descrito aquí utiliza muestras de línea celular humana suspensión para extracción de ADN. Hemos optimizado los tiempos de paso de aguja de corte, la relación del ADN de HMW transposasa y el momento de la ligadura para producir los resultados descritos. El protocolo puede ser ampliado en cuatro maneras. En primer lugar, los usuarios pueden iniciar con otras células mamíferos cultivadas y con diferente cantidad de células, tejidos, muestras clínicas u otros organismos. Se necesitará mayor optimización en el tiempo de lisis de incubación, volumen de reacción y centrifugación. En segundo lugar, es difícil predecir el tamaño de destino para la secuencia de lectura ultra largo. Si la lectura son más cortas de lo esperado, los usuarios pueden ajustar los tiempos de paso en el método basado en el corte mecánico o cambiar la relación entre el ADN de HMW a transposasa en el método basado en la fragmentación de la transposasa. Tiempo de encuadernación y elución durante los pasos de limpieza son útiles porque el ADN de HMW es altamente viscoso. En tercer lugar, con dispositivos de secuencia diferentes nanopore, uno puede ajustar la cantidad y el volumen de la DNA para cumplir los criterios del secuenciador. Cuarto, solamente ésos DNA ligada a adaptadores de secuencia va ser secuenciado. Para mejorar aún más la eficacia de la ligadura, uno puede intentar valorar las concentraciones de adaptador y ligasa. Tiempo de ligadura modificada y agentes crowding moleculares como PEG18 pueden aplicarse en el futuro. El protocolo de secuenciación de ADN ultra largo combinado con CRISPR19,20 puede ofrecer una herramienta eficaz para la secuencia de enriquecimiento objetivo.
Los autores declaran que no tienen intereses financieros que compiten.
Los autores agradecen a Zhu Y. por sus comentarios sobre el manuscrito. Investigación en esta publicación fue apoyada parcialmente por el Instituto Nacional del cáncer de los institutos nacionales de salud bajo la concesión número P30CA034196. El contenido es responsabilidad exclusiva de los autores y no representan necesariamente las opiniones oficiales de los institutos nacionales de salud.
Name | Company | Catalog Number | Comments |
Reagents | |||
Absolute ethanol | Sigma-Aldrich | E7023 | |
Agencourt AMPure XPbeads | Beckman | A63881 | magnetic beads for cleanup |
BD conventional needles | Becton Dickinson | 305136 | 27G, for mechanical shearing |
BD Luer-Lok syringe | Becton Dickinson | 309628 | for mechanical shearing |
Blunt/TA Ligase Master Mix | NEB | M0367S | |
Countess Cell Counting Chamber Slides | Invitrogen | C10228 | for cell counting |
EDTA | Invitrogen | AM9261 | pH 8.0, 0.5 M, 500 mL |
Flow Cell | Oxford Nanopore Technologies | FLO-MIN106 | R9.4.1 |
HG00773 cells | Coriell Institute | HG00733 | cells used in this protocol |
Ligation Sequencing Kit 1D | Oxford Nanopore Technologies | SQK-LSK108 | nanopore ligation kit |
MaXtract High Density tubes | Qiagen | 129073 | gel tubes |
NEBNext FFPE DNA Repair Mix | NEB | M6630S | |
NEBNext Ultra II End Repair/dA-Tailing Module | NEB | M7546S | |
Nuclease-free water | Invitrogen | AM9937 | |
Phosphate-Buffered Saline, PBS | Gibco | 70011044 | 10X, pH 7.4 |
Phenol:chloroform:IAA | Invitrogen | AM9730 | |
Proteinase K | Qiagen | 19131 | 20 mg/mL |
Qubit dsDNA BR Assay Kit | Invitrogen | Q32850 | fluorometer assays for DNA quantification |
Rapid Sequencing Kit | Oxford Nanopore Technologies | SQK-RAD004 | nanopore transposase kit |
RNase A | Qiagen | 19101 | 100 mg/mL |
SDS | Invitrogen | AM9822 | 10% (wt/vol) |
Sodium chloride solution | Invitrogen | AM9759 | 5.0 M |
TE buffer | Invitrogen | AM9849 | pH 8.0 |
Tris | Invitrogen | AM9856 | pH 8.0, 1 M |
Triton X-100 solution | Sigma-Aldrich | 93443 | ~10% |
Name | Company | Catalog Number | Comments |
Equipment | |||
Bio-Rad C1000 Thermal Cycler | Bio-Rad | 1851196EDU | |
Centrifuge 5810R | Eppendorf | 22628180 | |
Countess II FL Automated Cell Counter | Life Technologies | AMQAF1000 | for cell counting |
DynaMag-2 Magnet | Life Technologies | 12321D | magnetic rack |
Eppendorf ThermoMixer | Eppendorf | 5382000023 | for incubation |
Freezer | LabRepCo | LHP-5-UFMB | |
GridION | Oxford Nanopore Technologies | GridION X5 | nanopore device used in this protocol |
HulaMixer Sample Mixer | Thermo Fisher Scientific | 15920D | rotator mixer |
MicroCentrifuge | Benchmark Scientific | C1012 | |
NanoDrop ND-1000 Spectrophotometer | Thermo Fisher Scientific | ND-1000 | for UV reading |
Pippin Pulse | Sage Science | PPI0200 | pulsed-field gel electrophoresis instrument |
Qubit 3.0 Fluorometer | Invitrogen | Q33216 | fluorometer |
Refrigerator | LabRepCo | LABHP-5-URBSS | |
Vortex-Genie 2 | Scientific Industries | SI-A236 | |
Water bath | VWR | 89501-464 |
Solicitar permiso para reutilizar el texto o las figuras de este JoVE artículos
Solicitar permisoThis article has been published
Video Coming Soon
ACERCA DE JoVE
Copyright © 2025 MyJoVE Corporation. Todos los derechos reservados