Method Article
Lungo-ha letto sequenze notevolmente facilitano l'assemblaggio di complessi genomi e caratterizzazione di variazione strutturale. Descriviamo un metodo per generare sequenze ultra-lunghi di piattaforme nanopore di sequenziamento. L'approccio adotta un'estrazione di DNA ottimizzata seguita da preparazioni di libreria modificata per generare centinaia di kilobase letture con moderata copertura da cellule umane.
Terza generazione di tecnologie di sequenziamento del DNA di singola molecola offrono significativamente più leggere lunghezza che possa facilitare l'assemblaggio di complessi genomi e analisi delle varianti strutturali complessi. NanoPore piattaforme eseguire sequenziamento di singola molecola misurando direttamente le modifiche correnti mediate dal passaggio di DNA attraverso i pori e possono generare centinaia di letture kilobasi (kb) con il minimo costo di capitale. Questa piattaforma è stata adottata da molti ricercatori per una varietà di applicazioni. Raggiungimento di lunghezze per saperne di sequenziamento è il fattore più critico di sfruttare il valore di piattaforme di sequenziamento nanopore. Per generare letture ultra-lunghe, particolare attenzione è necessaria per evitare rotture del DNA e guadagnare in efficienza per generare modelli produttivi sequenziamento. Qui, forniamo il protocollo dettagliato di sequenziamento del DNA ultra-lungo compresa l'estrazione di DNA ad alto peso molecolare (HMW) dalle cellule fresche o surgelate, costruzione della libreria di tosatura meccanica o transposase frammentazione e la sequenziazione su un dispositivo nanopore. Da 20-25 µ g di DNA HMW, può raggiungere il metodo N50 leggere lunghezza di 50-70 kb con taglio meccanico e N50 di 90-100 kb leggere lunghezza con transposase mediata frammentazione. Il protocollo può essere applicato a DNA Estratto da cellule di mammifero per eseguire il sequenziamento dell'intero genoma per il rilevamento di varianti strutturali e assemblaggio del genoma. Ulteriori miglioramenti sull'estrazione del DNA e reazioni enzimatiche ulteriormente aumentare la lunghezza di lettura ed espandere la sua utilità.
Nell'ultimo decennio, massicciamente parallelo e tecnologie di seconda generazione ad alta velocità altamente accurato sequenziamento hanno guidato un'esplosione di biomedica scoperta e innovazione tecnologica1,2,3. Nonostante i progressi tecnici, i breve-lettura dati generati dalle piattaforme di seconda generazione sono inefficaci nel risolvere complesse regioni genomiche e sono limitati nella rilevazione delle varianti strutturali genomiche (SVs), che svolgono i ruoli importanti nell'uomo evoluzione e malattie4,5. Inoltre, breve-lettura dati sono in grado di risolvere la ripetizione variazione e non sono adatti per esigenti aplotipo scaglionamento delle varianti genetiche6.
Recenti progressi nel sequenziamento di singola molecola offre significativamente più lungo leggere lunghezza, che può facilitare l'individuazione dello spettro completo di SVs7,8,9e offerte accurate e complete di assemblaggio del complesso genomi microbici e mammiferi6,10. La piattaforma nanopore esegue sequenziamento di singola molecola misurando direttamente le modifiche correnti mediate da passaggio di DNA attraverso i pori11,12,13. A differenza di qualsiasi esistente chimica di sequenziamento del DNA, sequenziamento nanopore può generare lunga (decine di migliaia di kilobasi) letture in tempo reale senza fare affidamento sulla cinetica della polimerasi o artificiale amplificazione del campione del DNA. Di conseguenza, nanopore long-lettura sequenziamento (NLR-seq) detiene grande promessa per la generazione di ultra-lunghe lunghezze lettura ben oltre 100 kb, che avrebbe notevolmente progredire analisi genomiche e biomedica14, in particolare nella bassa complessità o ricchi di ripetizione regioni del genoma15.
La caratteristica unica di sequenziamento nanopore è suo potenziale per generare lunga legge senza una limitazione di lunghezza teorica. Pertanto, la lettura lunghezza dipende la lunghezza fisica del DNA che risente direttamente la qualità di modello di integrità e sequenziamento del DNA. Inoltre, a seconda dell'entità della manipolazione e il numero di passaggi, come forze di pipettaggio e condizioni di estrazione, la qualità del DNA è altamente variabile. Di conseguenza, è difficile per uno a cedere lunghe letture applicando solo i protocolli di estrazione del DNA standard e metodi di costruzione di libreria in dotazione dal produttore. A questo scopo abbiamo sviluppato un robusto metodo per generare lungo ultra leggere (centinaia di kilobasi) dati di sequenziamento a partire da palline delle cellule raccolte. Abbiamo adottato diversi miglioramenti nelle procedure di preparazione di DNA estrazione e biblioteca. Abbiamo semplificato il protocollo per escludere le procedure inutili che causano danni e degradazione del DNA. Questo protocollo è composto di alto peso molecolare (HMW) estrazione del DNA, ultra-lunga costruzione della libreria del DNA e l'ordinamento su una piattaforma nanopore. Per un biologo molecolare ben addestrato, che in genere dura 6 ore dalla raccolta al completamento dell'estrazione del DNA HMW, 90 min o 8 h per la costruzione della libreria a seconda del metodo di taglio e fino a un ulteriore 48 h per il sequenziamento del DNA delle cellule. L'uso del protocollo consentirà alla comunità di genomica di migliorare la nostra comprensione della complessità del genoma e una visione nuova variazione del genoma in malattie umane.
Nota: Il protocollo NLR-seq è costituito da tre passaggi consecutivi: 1) estrazione di grande molecolarità peso DNA genomico (HMW); 2) si conclude la costruzione della libreria del DNA ultra-lunga, che comprende la frammentazione del DNA HMW nella misura desiderata e legatura degli adattatori di sequenziamento del DNA; e 3) caricamento del DNA adattatore-legati sulle matrici di nanopori (Figura 1).
1. estrazione del DNA HMW
2. ultra-lunga costruzione della libreria del DNA
Nota: Esistono due modi per costruire le librerie di DNA ultra-lunghe basate su due diversi metodi di taglio accoppiati con nanopore Kit di sequenziamento. Una libreria basata su tosatura meccanica produce dati con un N50 del 50-70 kb, prendendo circa 8 h per la costruzione della libreria. Una libreria di base di frammentazione di transposase produce un N50 di 90-100 kb di dati, prendendo solo 90 min per la costruzione della libreria. Il protocollo di taglio meccanico dà maggiore resa dal DNA stesso input utilizzando versioni identiche di adattatore di sequenziamento e la qualità delle celle di flusso nanopore.
3. sequenziamento sul dispositivo nanopore
Il protocollo di sequenziamento DNA ultra-lungo si applica HMW DNA per la costruzione della libreria. Pertanto, è fondamentale scegliere celle ben coltivate con il rapporto dal vivo > 85% dalla cella in fase di raccolta. La quantità di celle utilizzate per l'estrazione di DNA influenzerà la qualità e la quantità del DNA HMW. La lisi delle cellule non funziona bene se a partire con troppe cellule. Usando troppo poche cellule non genera abbastanza DNA per la costruzione della libreria perché la precipitazione del DNA HMW viene eseguita utilizzando delicata rotazione a mano invece di centrifugazione ad alta velocità. Un esempio del DNA HMW dopo l'aggiunta di etanolo 100% ghiacciata e rotazione è indicato come il precipitato bianco di cotone-come nella Figura 2.
È importante controllare la qualità dell'input del DNA prima di iniziare la costruzione della libreria. Degradazione, non corretta quantificazione, contaminazione (ad es., proteine, RNA, detergenti, tensioattivo e residua fenolo o etanolo) e basso peso molecolare di DNA possono avere un effetto significativo sulle procedure successive e sul finale leggere lunghezza. Si consiglia di eseguire l'analisi QC usando il DNA da tre diverse posizioni nella provetta contenente il DNA HMW. Da UV lettura dei risultati del DNA HMW, il valore di280 OD260/OD è circa 1.9 e il valore di230 di OD260/OD è circa 2.3 (Figura 3AB). Questi valori di rapporto sono coerenti tra le tre prove per un buon campione di DNA HMW. Diversi metodi di taglio richiede diversi volumi di ingresso del DNA. La concentrazione di DNA HMW deve essere > 200 ng / µ l per la tosatura meccanica, mentre deve essere > 1 µ g / µ l per transposase frammentazione. La concentrazione rilevata da un fluorimetro è di poco inferiore a UV lettura. Tuttavia, il coefficiente di variazione della concentrazione dello stesso campione di DNA HMW deve essere inferiore al 15% con il fluorimetro e UV lettura di saggi. Cesoia meccanica, si applica una siringa con un ago per rompere il DNA HMW, in modo che il numero di passaggi attraverso l'ago avrà un impatto la dimensione del DNA tranciata e finale leggere lunghezza. È consigliabile eseguire la dimensione QC dopo ago tosatura per garantire la maggior parte del DNA HMW è maggiore di 50 kb come illustrato nella Figura 4. Nel metodo di taglio meccanico, 30 pass generato i migliori risultati di sequenziamento, considerando la lunghezza e l'uscita.
La N50 di una libreria basata su taglio meccanica è 50-70 kb mentre è una libreria di base di frammentazione di transposase 90-100 kb. I risultati di quattro esecuzioni utilizzando la linea cellulare HG00733 sono riportati nella tabella 1. Tutti i quattro funzionamenti hanno oltre 2.300 letture con lunghezza più di 100 kb. La lunghezza massima è più lunga nelle transposase basati su frammentazione librerie (455 kb e 489 kb) confrontate con le librerie basate su taglio meccaniche (348 kb e 387 kb) mentre il secondo prodotto più totale letture, che indica un più alto rendimento. La costruzione della libreria base di frammentazione transposase ha un minor numero di passaggi e tempi di preparazione più brevi in modo che introdurrà meno brevi frammenti. Le due esecuzioni utilizzando transposase hanno una lunghezza media più lunga (> 30 kb) e la lunghezza mediana (> 10 kb). Inoltre, i dati mostrano alta qualità costante in tutte le esecuzioni (Punteggio di qualità media è circa 10.0, ~ 90% di precisione base). Oltre il 97% delle basi totali sono stato allineato al genoma umano riferimento (hg19) utilizzando Minimap216 con le impostazioni predefinite. Le distribuzioni di dimensione prevista del crudi si legge sono illustrate nella Figura 5. Tutte le esecuzioni hanno una grande percentuale di dati superiore a 50 kb mentre librerie basate su frammentazione transposase hanno un più alto rapporto di ultra-lunghe letture (ad es. > 100 kb). Questo protocollo è stato applicato con successo nelle linee cellulari umane multiple (complementare tabella 1).
Figura 1: Panoramica schematica del flusso di lavoro lungo-lettura sequenziamento (NLR-seq) nanopore. Orange, la transposase complesso. Giallo-verde, l'adattatore nanopore. Clicca qui per visualizzare una versione più grande di questa figura.
Figura 2: precipitazione del DNA rappresentativi dal metodo di estrazione del fenolo-cloroformio. La freccia bianca indica il DNA HMW. Clicca qui per visualizzare una versione più grande di questa figura.
Figura 3: risultati di esempio QC del DNA HMW da rilevazione UV. (A) DNA HMW dal passaggio 1.21.1 pronto per la costruzione della libreria di tosatura-base meccanica. (B) DNA HMW 1.21.2 nel passaggio per la costruzione della libreria di base di frammentazione transposase. Clicca qui per visualizzare una versione più grande di questa figura.
Figura 4: risultati QC dell'ago Tosato HMW DNA tramite l'elettroforesi del gel del pulsare-campo. L1: Quick-carico 1 kb DNA ladder; L2: Quick-carico estendere 1 kb DNA ladder. 1-8: DNA con passaggio diverse volte attraverso la tosatura dell'ago. 1-3, nessun taglio; 4, 10 volte; 5, 20 volte; 6, 30 volte; 7, 40 volte; 8, 50 volte. Questo passaggio QC è facoltativo. Clicca qui per visualizzare una versione più grande di questa figura.
Figura 5: previsto distribuzioni di dimensione delle librerie del DNA ultra-lunghe nanopore. MS, librerie basate su taglio meccaniche. TF, librerie basate su frammentazione transposase. Clicca qui per visualizzare una versione più grande di questa figura.
Shearing_rep1 meccanica | Shearing_rep2 meccanica | Transposase fragmentation_rep1 | Transposase fragmentation_rep2 | |
Linea cellulare | HG00733 | HG00733 | HG00733 | HG00733 |
N50 del legge | 55.180 | 63.007 | 98.237 | 95.629 |
Numero di letture più di 100 Kb | 2.500 | 3.082 | 2.386 | 2.355 |
Numero di letture totale | 97.859 | 80.465 | 24.166 | 21.032 |
Lunghezza massima (bp) | 348.482 | 387.113 | 454.660 | 489.426 |
Lunghezza media (bp) | 17.861 | 20.395 | 33.528 | 38.175 |
Lunghezza mediana (bp) | 5.335 | 5.894 | 10.249 | 15.656 |
Sinonimo di qualità della legge | 10.0 | 10.1 | 9.9 | 10.0 |
Basi totali di crude letture | 1,747,849,822 | 1,641,058,932 | 810,229,733 | 802,886,304 |
Basi totali di allineati letture | 1,693,300,832 | 1,607,975,925 | 791,422,077 | 778,417,627 |
Rapporto mappata di basi totali (hg19, Minimap2) | 96,9% | 98,0% | 97,7% | 97,0% |
Numero di pori di attivi | 1225: 480, 402, 254, 89 | 1058: 480, 356, 176, 46 | 958: 452, 328, 148, 30 | 1092: 487, 367, 195, 43 |
Tabella 1: Riepilogo dalle metriche delle prestazioni viene eseguito con diversi protocolli di tosatura.
Libreria 1 | Libreria 2 | |
Linea cellulare | K562 | GM19240 |
Cella di dati per l'ordine | ATCC, cat. No. CCL-243 | Coriell Institute, cat. No. GM19240 |
Protocollo | taglio meccanico | taglio meccanico |
N50 del legge | 60.063 | 55.295 |
Numero di letture totale | 193.783 | 120.807 |
Lunghezza mediana (bp) | 1.843 | 4.688 |
Lunghezza media (bp) | 9.825 | 17.408 |
Lunghezza massima (bp) | 548.780 | 212.338 |
Basi totali di crude letture | 1,903,989,686 | 2,103,015,331 |
Basi totali di allineati letture | 1,837,350,047 | 1,997,419,761 |
Rapporto mappata di basi totali (hg19, Minimap2) | 96,6% | 95,0% |
Numero di pori di attivi | 1111: 482, 371, 203, 55 | 1032: 447, 333, 196, 56 |
Complementare tabella 1: Sintesi delle due esecuzioni di NLR-seq utilizzando altre linee cellulari con il protocollo di taglio meccanico.
In linea di principio, è in grado di generare 100 kb a megabase letture in lunghezza11,12,13nanopore sequenziamento. Quattro principali fattori influirà sulle prestazioni della qualità di esecuzione e i dati di sequenziamento: 1) poro attivo numeri e l'attività dei pori; 2) motore proteina, che controlla la velocità del DNA passando attraverso il nanoporo; 3) modello DNA (lunghezza, purezza, qualità, massa); 4) sequenziamento adattatore legatura efficienza, che determina il DNA utilizzabile dall'esempio di input. I primi due fattori dipendono dalla versione di cella di flusso e il kit di sequenziamento fornito dal produttore. I secondi due fattori sono punti critici in questo protocollo (estrazione del DNA HMW, tosatura e legatura).
Questo protocollo richiede pratica e pazienza. La qualità del DNA HMW è importante per ultra-lungo di librerie di DNA6. Il protocollo inizia con le cellule raccolte con elevata redditività (> 85% di cellule vitali preferita), limitando il DNA degradato dalle cellule morte. Qualsiasi processo difficili che può introdurre danni al DNA (ad es., forte inquietante, agitazione, vortice, più pipettaggio, ripetuto congelamento e scongelamento) dovrebbe essere evitato. Nella progettazione del protocollo, omettiamo di pipettaggio in tutto il processo di estrazione del DNA. Ampio foro suggerimenti devono essere utilizzati quando il pipettaggio è necessario dopo la tosatura meccanica durante la costruzione della libreria e il sequenziamento. Come i nanopori sono sensibili le composizioni chimiche nella camera tampone12, ci dovrebbe essere come pochi residui contaminanti (ad esempio, i detergenti, tensioattivi, fenolo, etanolo, proteine RNA, ecc.) come possibile nel DNA. Considerando la lunghezza e la resa, il metodo di estrazione del fenolo Mostra i risultati migliori e più riproducibili rispetto ai molteplici metodi di estrazione differenti provati finora.
Nonostante la capacità di questo protocollo di produrre sequenze di lungo-ha letto, restano ancora diverse limitazioni. In primo luogo, questo protocollo è stato ottimizzato basato sul dispositivo di sequenziamento nanopore disponibile al momento della pubblicazione; quindi, esso è limitato alla chimica selettiva di sequenziamento nanopore e poteva essere non ottimale quando eseguita in altri tipi di dispositivi di lettura lunga sequenza. In secondo luogo, il risultato è altamente dipendente dalla qualità del DNA estratto dal materiale di partenza (tessuti o cellule). Lunghezza di lettura sarà compromessa se il DNA di partenza è già degradato o danneggiato. In terzo luogo, anche se più passaggi di QC sono incorporati nel protocollo per controllare la qualità del DNA, la resa finale e la lunghezza della legge può essere influenzate da cella di flusso e attività, che potrebbe essere variabile in questa fase iniziale della piattaforma di sequenziamento nanopore del poro sviluppo.
Il protocollo descritto qui utilizza campioni di linea cellulare umana sospensione per estrazione del DNA. Abbiamo ottimizzato i tempi di passaggio nell'ago di tosatura, il rapporto di DNA HMW al transposase ed il tempo di legatura per produrre i risultati descritti. Il protocollo può essere espansa in quattro modi. In primo luogo, gli utenti possono avviare con altre cellule di mammiferi coltivate e con diverse quantità di cellule, tessuti, campioni clinici o altri organismi. Ulteriore ottimizzazione per tempo di incubazione di Lisi, il volume di reazione e centrifugazione sarà necessari. In secondo luogo, è difficile prevedere le dimensioni di destinazione per la sequenza di lettura ultra-lungo. Se le lunghezze di lettura sono più breve del previsto, gli utenti possono regolare i tempi di passaggio nel metodo basato su taglio meccanico o modificare il rapporto del DNA HMW transposase nel metodo basato su frammentazione transposase. Tempo maggiore di associazione e di eluizione durante la procedura di pulizia sono utili perché il DNA HMW è altamente viscoso. In terzo luogo, con dispositivi di sequenziamento nanopore diversi, si può regolare la quantità e il volume del DNA per soddisfare i criteri del sequencer. In quarto luogo, solo quelli DNA legato agli adattatori di sequenziamento sarà sequenziati. Per migliorare ulteriormente l'efficienza di legatura, si può tentare di titolare le concentrazioni di adattatore e ligasi. Tempo di legatura modificate e agenti molecolari affollamento come PEG18 possono essere applicati in futuro. Il protocollo di sequenziamento DNA ultra-lungo combinato con CRISPR19,20 può offrire uno strumento efficace per il sequenziamento di arricchimento di destinazione.
Gli autori dichiarano di non avere nessun concorrenti interessi finanziari.
Gli autori ringraziano Y. Zhu per i suoi commenti sul manoscritto. Ricerca riportata in questa pubblicazione è stata parzialmente sostenuta dal National Cancer Institute del National Institutes of Health, sotto Premio numero P30CA034196. Il contenuto è di esclusiva responsabilità degli autori e non rappresentano necessariamente il punto di vista ufficiale del National Institutes of Health.
Name | Company | Catalog Number | Comments |
Reagents | |||
Absolute ethanol | Sigma-Aldrich | E7023 | |
Agencourt AMPure XPbeads | Beckman | A63881 | magnetic beads for cleanup |
BD conventional needles | Becton Dickinson | 305136 | 27G, for mechanical shearing |
BD Luer-Lok syringe | Becton Dickinson | 309628 | for mechanical shearing |
Blunt/TA Ligase Master Mix | NEB | M0367S | |
Countess Cell Counting Chamber Slides | Invitrogen | C10228 | for cell counting |
EDTA | Invitrogen | AM9261 | pH 8.0, 0.5 M, 500 mL |
Flow Cell | Oxford Nanopore Technologies | FLO-MIN106 | R9.4.1 |
HG00773 cells | Coriell Institute | HG00733 | cells used in this protocol |
Ligation Sequencing Kit 1D | Oxford Nanopore Technologies | SQK-LSK108 | nanopore ligation kit |
MaXtract High Density tubes | Qiagen | 129073 | gel tubes |
NEBNext FFPE DNA Repair Mix | NEB | M6630S | |
NEBNext Ultra II End Repair/dA-Tailing Module | NEB | M7546S | |
Nuclease-free water | Invitrogen | AM9937 | |
Phosphate-Buffered Saline, PBS | Gibco | 70011044 | 10X, pH 7.4 |
Phenol:chloroform:IAA | Invitrogen | AM9730 | |
Proteinase K | Qiagen | 19131 | 20 mg/mL |
Qubit dsDNA BR Assay Kit | Invitrogen | Q32850 | fluorometer assays for DNA quantification |
Rapid Sequencing Kit | Oxford Nanopore Technologies | SQK-RAD004 | nanopore transposase kit |
RNase A | Qiagen | 19101 | 100 mg/mL |
SDS | Invitrogen | AM9822 | 10% (wt/vol) |
Sodium chloride solution | Invitrogen | AM9759 | 5.0 M |
TE buffer | Invitrogen | AM9849 | pH 8.0 |
Tris | Invitrogen | AM9856 | pH 8.0, 1 M |
Triton X-100 solution | Sigma-Aldrich | 93443 | ~10% |
Name | Company | Catalog Number | Comments |
Equipment | |||
Bio-Rad C1000 Thermal Cycler | Bio-Rad | 1851196EDU | |
Centrifuge 5810R | Eppendorf | 22628180 | |
Countess II FL Automated Cell Counter | Life Technologies | AMQAF1000 | for cell counting |
DynaMag-2 Magnet | Life Technologies | 12321D | magnetic rack |
Eppendorf ThermoMixer | Eppendorf | 5382000023 | for incubation |
Freezer | LabRepCo | LHP-5-UFMB | |
GridION | Oxford Nanopore Technologies | GridION X5 | nanopore device used in this protocol |
HulaMixer Sample Mixer | Thermo Fisher Scientific | 15920D | rotator mixer |
MicroCentrifuge | Benchmark Scientific | C1012 | |
NanoDrop ND-1000 Spectrophotometer | Thermo Fisher Scientific | ND-1000 | for UV reading |
Pippin Pulse | Sage Science | PPI0200 | pulsed-field gel electrophoresis instrument |
Qubit 3.0 Fluorometer | Invitrogen | Q33216 | fluorometer |
Refrigerator | LabRepCo | LABHP-5-URBSS | |
Vortex-Genie 2 | Scientific Industries | SI-A236 | |
Water bath | VWR | 89501-464 |
Richiedi autorizzazione per utilizzare il testo o le figure di questo articolo JoVE
Richiedi AutorizzazioneThis article has been published
Video Coming Soon