Method Article
Il sequenziamento di nanopore è una nuova tecnologia che consente un sequenziamento conveniente in posizioni remote e impostazioni di scarsa risorse. Qui, presentiamo un protocollo per il sequenziamento di mRNA da sangue intero che è compatibile con tali condizioni.
La sequenza in posizioni remote e le impostazioni di scarsa risorse presentano sfide uniche. Il sequenziamento di nanopore può essere utilizzato con successo in tali condizioni ed è stato distribuito in Africa occidentale durante la recente epidemia di virus Ebola, evidenziando questa possibilità. Oltre ai vantaggi pratici (basso costo, facilità di trasporto e utilizzo delle attrezzature), questa tecnologia offre anche vantaggi fondamentali rispetto agli approcci di sequenziamento di seconda generazione, in particolare la lunghezza di lettura molto lunga, la capacità di sequenziare direttamente L'RNA e la disponibilità in tempo reale dei dati. La precisione di lettura RAW è inferiore rispetto ad altre piattaforme di sequenziamento, che rappresenta la principale limitazione di questa tecnologia; Tuttavia, questo può essere parzialmente mitigato dall'alta profondità di lettura generata. Qui, presentiamo un protocollo compatibile sul campo per il sequenziamento della codifica mRNAs per Niemann-Pick C1, che è il recettore cellulare per ebolaviruses. Questo protocollo comprende l'estrazione di RNA da campioni di sangue animale, seguita da RT-PCR per l'arricchimento del bersaglio, barcoding, preparazione della libreria, e la sequenza di esecuzione stessa, e può essere facilmente adattato per l'uso con altri bersagli di DNA o RNA.
Il sequenziamento è uno strumento potente e importante nella ricerca biologica e biomedica. Esso consente l'analisi di Genomes, variazioni genetiche, e profili di espressione di RNA, e quindi svolge un ruolo importante nell'indagine delle malattie umane e animali allo stesso modo1,2. Il sequenziamento con metodo Sanger, uno dei metodi più antichi disponibili per il sequenziamento del DNA, è ancora abitualmente utilizzato fino ad oggi ed è stato un angolo-pietra della biologia molecolare. Negli ultimi 50 anni, questa tecnologia è stata migliorata per ottenere una lunghezza di lettura superiore a 1.000 NT e una precisione superiore a 99,999%1. Tuttavia, il sequenziamento di Sanger ha anche dei limiti. Sequenziare un insieme più ampio di campioni o l'analisi di interi geniti con questo metodo richiede molto tempo e costoso1,3. I metodi di sequenziamento del DNA di seconda generazione (di nuova generazione), come il pirosequenziamento 454 e la tecnologia illumina, ci hanno permesso di ridurre significativamente i costi e il carico di lavoro richiesti per il sequenziamento nell'ultimo decennio, e hanno portato ad un enorme aumento del quantità di informazioni sulla sequenza biologica disponibili4. Tuttavia, le singole sequenze di sequenziamento che utilizzano queste tecnologie di seconda generazione sono costose e il sequenziamento in condizioni di campo è impegnativo, in quanto l'equipaggiamento necessario è ingombrante e fragile (simile ai dispositivi di sequenziamento Sanger) e spesso deve essere calibrato e servito da personale appositamente addestrato. Inoltre, per molte delle tecnologie di seconda generazione, le lunghezze di lettura sono piuttosto limitate, il che spesso rende difficile l'analisi bioinformatica a valle di questi dati.
Il sequenziamento di terza generazione che utilizza dispositivi di sequenziamento di nanoparticelle di dimensioni tascabili (Vedi tabella dei materiali) può fungere da alternativa a queste piattaforme di sequenziamento consolidate. In questi dispositivi una molecola di DNA o RNA a filamento singolo passa attraverso un nanoporo simultaneamente con una corrente ionica che viene poi misurata da un sensore (Figura 1). Come il filo attraversa il nanopore, la modulazione della corrente dai nucleotidi presenti nel poro in un dato momento viene rilevata, e computazionalmente indietro-tradotto nella sequenza nucleotide5. A causa di questo principio operativo, il sequenziamento del nanoporo consente sia la generazione di letture molto lunghe (vicino a 1 x 106 nucleotidi6) e l'analisi dei dati di sequenziamento in tempo reale. Il barcoding è possibile collegando sequenze nucleotidiche definite agli acidi nucleici in un campione, che consente l'analisi di più campioni in una singola sequenza di sequenziamento, aumentando così la velocità effettiva del campione e abbassando i costi per campione. Grazie alla loro elevata portabilità e facilità d'uso, i dispositivi di sequenziamento delle nanoparticelle sono stati utilizzati con successo nel campo durante la recente epidemia di malattia da virus Ebola in Africa occidentale, evidenziando la loro idoneità per un rapido dispiegamento in regioni remote7 , 8. il
Qui, descriviamo un protocollo dettagliato compatibile con il campo per il sequenziamento della codifica mRNA per la proteina Niemann-Pick C1 (NPC1), che è il recettore di ingresso obbligato per filovirus come ebolaviruses, e ha dimostrato di limitare la suscettibilità delle specie a questi virus9,10. Il protocollo comprende l'estrazione dell'intero RNA da campioni di sangue, l'amplificazione specifica di NPC1 mRNA da RT-PCR, la barcoding dei campioni, la preparazione della libreria e il sequenziamento con un dispositivo di sequenziamento di nanoporo. L'analisi dei dati non può essere discussa a causa di limitazioni di spazio, anche se alcune direzioni di base sono fornite nei risultati rappresentativi; Tuttavia, il lettore interessato è riferito a una precedente pubblicazione11 per una descrizione più dettagliata del flusso di lavoro che abbiamo utilizzato, nonché alle pubblicazioni di altri12,13,14 per informazioni dettagliate per quanto riguarda gli strumenti di analisi utilizzati in questo flusso di lavoro.
I campioni sono stati raccolti seguendo il protocollo NUIRB (Njala University Institutional Review Board). IRB00008861/FWA00018924.
1. estrazione di RNA da campioni di sangue
2. trascrizione inversa di NPC1 mRNA in cDNA
3. amplificazione della cornice di lettura NPC1 Open
4. barcoding di NPC1 amplicons
5. preparazione della biblioteca
6. controllo di qualità della cella di flusso
7. caricamento della cella di flusso e avvio della sequenza di esecuzione
In un esperimento rappresentativo per testare il protocollo presentato abbiamo estratto l'RNA da 10 diversi campioni di sangue di cinque specie animali (cioè 2 individui per specie (capra, pecore, suini, cani, bovini)) (tabella 3). I rendimenti dell'RNA e la qualità dopo l'estrazione possono variare notevolmente, in particolare a causa delle differenze nella manipolazione e nello stoccaggio dei campioni. Nel nostro esperimento rappresentativo, abbiamo osservato concentrazioni di RNA tra 43 ng e 543 ng per μL (tabella 3). Inoltre, dopo l'amplificazione di RT-PCR, l'analisi del gel dei prodotti PCR NPC-1 ha mostrato vari esiti (Figura 2), con bande nettamente più deboli per i campioni BC01 e bc02 (entrambi caprini). Queste differenze sono state probabilmente causate da differenze nella qualità del campione, sebbene non sia possibile escludere differenze nell'efficacia della PCR dovute alle differenze nel legame del primer con il gene NPC1 di diverse specie. Tuttavia, queste differenze nella resa e/o nell'efficienza di amplificazione non hanno influito significativamente sull'esito complessivo del sequenziamento. Inoltre, si è verificato un ulteriore prodotto PCR non specifico nel campione BC10 (bovini). Contrariamente al sequenziamento di Sanger, tali prodotti non specifici non influenzano negativamente i risultati del sequenziamento delle nanoparticelle, poiché queste letture vengono scartate durante la mappatura delle letture ottenute in una sequenza di riferimento come parte dell'analisi dei dati.
Prima di ogni sequenza di sequenziamento, è fortemente raccomandato un controllo di qualità della cella di flusso da utilizzare, con un requisito minimo di 800 pori totali. Nel nostro esperimento rappresentativo, questo controllo di qualità ha restituito 1.102 pori disponibili per il sequenziamento. Poiché i dati sono forniti in tempo reale e possono essere analizzati immediatamente, la lunghezza di una sequenza di sequenziamento può essere regolata per la singola applicazione (ad esempio, fino a quando non vengono prodotti sufficienti dati di sequenziamento per l'analisi desiderata). Nei nostri esperimenti, le sequenze di sequenziamento sono tipicamente eseguite durante la notte, e nel caso del nostro esperimento rappresentativo abbiamo ottenuto circa 1,4 milioni letture durante una corsa di 14 ore.
A seconda del tipo di analisi dei dati da eseguire, può essere consigliabile elaborare solo un sottoinsieme delle letture ottenute. Nel caso del nostro esperimento rappresentativo, è stato selezionato un sottoinsieme di 10.000 letture per ulteriori analisi. A tal fine, i file FASTQ generati durante la sequenza di sequenziamento sono stati ulteriormente elaborati in un ambiente LTS Ubuntu 18,04 e demultiplate utilizzando Flexbar v 3.0.3 con parametri ottimizzati per demultiplexing dei dati di sequenziamento nanoporo (Barcode-Tail-lunghezza 300 , codice a barre-error-rate 0,2, codice a barre-Gap-penalità-1)12. Dopo la demultiplexing, la mappatura di lettura e la generazione di consensi possono essere eseguite utilizzando una serie di strumenti diversi, ma una discussione dettagliata dell'aspetto bioinformatico del sequenziamento del nanoporo va oltre l'ambito di questo manoscritto. Tuttavia, nel caso dei nostri risultati rappresentativi, la mappatura di lettura a una sequenza di riferimento è stata eseguita utilizzando Geneious 10.2.3. Di 10.000 letture analizzate, 5.457 ha mostrato una lunghezza tra 1.750 e 2.000 nucleotidi, che corrisponde alle dimensioni attese per i frammenti PCR amplificati come parte del nostro flusso di lavoro (1.769 NT, Figura 3). È stato osservato un ulteriore picco nella distribuzione della lunghezza delle letture tra 250 e 500 nucleotidi, che possono essere attribuiti a prodotti PCR non specifici. La demultiplexing delle letture ha consentito l'assegnazione di 87,6% delle letture a uno dei 10 codici a barre/campioni analizzati (Figura 4). La proporzione di letture demultiplexate per ogni codice a barre varia da 3,4% per codice a barre da 1 a 16,9% per codice a barre 10; Tuttavia, a causa del gran numero complessivo di letture questo ha ancora permesso un consenso significativo chiamando con una profondità di lettura elevata anche per questi DataSet di codici a barre di abbondanza inferiore. Infatti, la mappatura delle letture ordinate a una sequenza di riferimento di NPC1 ha comportato tra il 31,7% (codice a barre 2) e il 100% (codice a barre 7 e 8) di lettura del mapping al riferimento, dando una profondità di lettura superiore a 90 letture in qualsiasi posizione per ogni campione. Questo è poi più che sufficiente per consentire fiducioso consenso base-chiamando con un tasso di errore trascurabile.
Figura 1: rappresentazione schematica del sequenziamento del DNA utilizzando la tecnologia nanoporo. Una molecola di DNA a filamento singolo passa attraverso un nanoporo incorporato in una membrana resistente elettricamente, con una elicasi che regola la velocità di transizione. Una corrente ionica passa simultaneamente attraverso il poro e viene misurata continuamente. Le modulazioni della corrente causate dai nucleotidi presenti nel poro vengono rilevate e ritradotte computazionalmente nella sequenza nucleotide del filamento del DNA. Si prega di cliccare qui per visualizzare una versione più grande di questa cifra.
Figura 2: amplificazione dei prodotti di PCR di Niemann-Pick C1 da mRNA. mRNA è stato isolato da capra (BC01), pecore (BC03 e 04), suini (BC05 e 06), cane (BC07 e 08), e bovini (BC09 e 10). I prodotti PCR nidificati sono stati separati in un gel di agarosio 0,8% in tampone TAE 1x (preparato con tampone TAE 50x: 242,28 g di base tris, 57,1 mL di acido acetico glaciale, 100 mL di 0,5 M EDTA, dH2O a 1 L, pH regolato a 8,0) per 45 min a 100 V e macchiato con SYBR safe. Si prega di cliccare qui per visualizzare una versione più grande di questa cifra.
Figura 3: distribuzione della lunghezza di lettura di 10.000 letture dall'esperimento rappresentativo. Viene indicato il numero di letture ottenute con un determinato intervallo di lunghezza di lettura. Si prega di cliccare qui per visualizzare una versione più grande di questa cifra.
Figura 4: distribuzione delle letture dopo il demultiplexing. Vengono mostrati il numero e la percentuale di letture demultiplate (grigie) e mappate (nere) per ogni codice a barre. Si prega di cliccare qui per visualizzare una versione più grande di questa cifra.
Tabella 1: Panoramica dei set di primer utilizzati. L'amplificazione iniziale delle sequenze di destinazione è stata eseguita con primer set 1. Primer set 2 è stato quindi utilizzato per l'amplificazione nidificata e l'aggiunta di adattatori. Gli adattatori sono indicati in rosso. Per favore clicca qui per scaricare questo file.
Tabella 2: Panoramica delle sequenze di codici a barre. I singoli codici a barre sono stati utilizzati per identificare ciascun campione sequenziato. Per favore clicca qui per scaricare questo file.
Tabella 3: concentrazioni di RNA ottenute in seguito all'estrazione da campioni di sangue sequenziati nell'esperimento rappresentativo. Vengono mostrate le concentrazioni di RNA di due individui da ciascuna delle cinque specie e vengono indicati i rapporti delle densità ottiche a 260/280 nm e 260/230 Nm. Per favore clicca qui per scaricare questo file.
Negli ultimi due decenni, il sequenziamento dei campioni biologici è diventato un aspetto sempre più importante degli studi in una vasta gamma di aree tematiche. Lo sviluppo di sistemi di sequenziamento di seconda generazione basati sul sequenziamento di una fitta gamma di caratteristiche del DNA che utilizzano cicli iterativi di manipolazione enzimatica e acquisizione dati basata su immagini1 ha aumentato drasticamente il throughput rispetto al tecnica di sequenziamento Sanger tradizionale e consente l'analisi di campioni multipli e di varie specie di acido nucleico in un dato campione in parallelo4. Tuttavia, per la maggior parte dei sistemi di seconda generazione comunemente usati, vengono prodotte solo letture brevi e tutte le piattaforme si basano su apparecchiature sensibili, ingombranti e costose3,4.
A differenza delle piattaforme di sequenziamento di seconda generazione, il dispositivo di sequenziamento utilizzato in questo protocollo si basa sulla tecnologia nanoporo. Qui una molecola di acido nucleico a filamento singolo passa attraverso un nanopore, con conseguente modulazione di una corrente ionica che scorre anche attraverso lo stesso nanopore, e che può essere misurata e ritradotta per dedurre la sequenza della molecola di acido nucleico. Questo approccio di sequenziamento di terza generazione conferisce una serie di vantaggi rispetto ad altri approcci. I principali vantaggi che sono direttamente correlati al principio di funzionamento unico di questa tecnologia sono la lunghezza di lettura estremamente lunga prodotta (lunghezze di lettura fino a 8,8 x 105 nucleotidi sono stati segnalati6), la capacità di sequenziare non solo il DNA, ma anche RNA direttamente, che è stato recentemente dimostrato per un genoma completo del virus dell'influenza17, e la capacità di analizzare i dati in tempo reale come vengono generati, che consente la rapida rilevazione metagenomica di agenti patogeni in minuti18. Ulteriori vantaggi pratici sono le dimensioni estremamente ridotte del dispositivo di sequenziamento di nanoporo, che ne consente l'utilizzo in qualsiasi laboratorio o in missioni sul campo in sedi remote19,20e il prezzo basso rispetto ad altri sequenziamento Piattaforme. In termini di costi di gestione, attualmente è necessaria una nuova cella di flusso per ogni esecuzione di sequenziamento, che comporta costi di circa $1.100 per corsa per la cella di flusso e i reagenti di preparazione della libreria. Questi costi possono essere ridotti in alcuni casi mediante il lavaggio e il riuso della cella di flusso, oppure mediante barcoding e sequenziamento di più campioni in una singola corsa. Inoltre, un nuovo tipo di cella di flusso è attualmente in fase di beta-testato da un piccolo numero di laboratori, che richiederà l'uso di un adattatore di cella di flusso (chiamato "flongle"), e dovrebbe ridurre significativamente il prezzo della cella di flusso e quindi i costi di funzionamento.
La maggiore carenza di sequenziamento del nanoporo rimane la sua accuratezza, con singole precisioni di lettura nell'intervallo da 83 a 86% segnalati6,21,22e la maggior parte delle imprecisioni causate da inserimento/eliminazione ( indels)5,21. Tuttavia, un'elevata profondità di lettura può compensare queste imprecisioni e un recente studio suggerito sulla base di considerazioni teoriche che una profondità di lettura di > 10 potrebbe aumentare la precisione complessiva a > 99,8%21. Tuttavia, saranno necessari ulteriori miglioramenti nella precisione, in particolare se l'analisi deve essere eseguita su un livello di singola molecola piuttosto che su un livello di sequenza di consenso. L'uso della tecnologia 1D2 come descritto in questo protocollo, che si basa sull'aggiunta degli adattatori 1D2 e Barcode (cfr. sezione 5,5) che determinano la sequenzione di entrambe le ciocche di una singola molecola di DNA, aumenta la lettura precisione poiché le informazioni provenienti da entrambi i filamenti di DNA possono essere utilizzate per la determinazione della sequenza. Inoltre, una strategia alternativa che può essere perseguito al fine di combinare i vantaggi del sequenziamento di nanoporo (particolarmente lunga lunghezza di lettura) con la maggiore accuratezza di altre tecnologie di sequenziamento è quello di utilizzare le informazioni di sequenziamento di nanoporo come un scaffold, che è poi lucidato utilizzando i dati di sequenziamento da altre piattaforme6.
Il fattore più critico per il successo del protocollo qui presentato è la qualità del campione, e in particolare la quantità e la qualità dell'RNA estratto. La corretta conservazione e l'estrazione tempestiva dell'RNA contribuiscono a ottenere un adeguato rendimento di RNA. L'uso di adeguati tubi di raccolta del sangue consente lo stoccaggio di campioni di sangue per un massimo di un mese, ma la coagulazione del sangue può essere un problema, in particolare quando i campioni vengono conservati a temperature elevate, che può essere il caso in condizioni di campo. Il secondo passo critico è l'amplificazione delle sequenze bersaglio, e in particolare in condizioni di campo le reazioni di PCR spesso eseguono meno bene rispetto alle condizioni di laboratorio standard7. A tal fine, un'attenta progettazione e ottimizzazione del primer è fondamentale per ottenere un'amplificazione robusta. Inoltre, gli approcci di PCR nidificati e la PCR da touchdown, utilizzati in questo protocollo, possono aumentare sia la specificità che la sensibilità dell'amplificazione del gene bersaglio4,7. Infatti, nella nostra esperienza in Liberia e in Guinea con questa tecnologia sono stati richiesti protocolli nidificati in condizioni di campo con campioni di campo anche per set di primer che hanno consentito l'amplificazione di bersagli da campioni di laboratorio e in condizioni di laboratorio con un singolo round di PCR (7 e risultati non pubblicati).
A differenza di questi passaggi più critici, la preparazione della libreria e la sequenza di esecuzione sono procedure piuttosto robuste. Tuttavia, in condizioni di campo, questioni pratiche come la disponibilità di alcuni pezzi di attrezzature possono essere problematici. Ad esempio, è necessario uno spettrofotometro UV per determinare le concentrazioni di DNA prima della preparazione della libreria di campioni con codice a barre. Tuttavia, se un tale dispositivo non fosse disponibile in condizioni di campo, un volume uguale di ciascun campione può essere semplicemente combinato per creare i 45 μL necessari per la preparazione della libreria, con differenze nel materiale di input del campione, che viene di solito mitigato dalla grande numero di letture. Analogamente, la necessità di connettività Internet per l'esecuzione del sequenziamento può essere un problema, anche se la chiamata di base non deve più essere eseguita online, ma può essere eseguita localmente; Tuttavia, questa necessità può essere rimossa in determinate circostanze dal fabbricante, se necessario.
In sintesi, il protocollo presentato consente un sequenziamento relativamente basso costo in posizioni senza accesso alle apparecchiature di sequenziamento tradizionali, anche in luoghi remoti. Può essere facilmente adattato a qualsiasi RNA o DNA target, permettendo così ai ricercatori di rispondere a numerose domande biologiche.
TH ha partecipato al programma di accesso anticipato di Oxford nanopore Technologies (ONT) MinION da 2014 a 2015 e ha ricevuto dispositivi MinION e celle di flusso per un precedente studio 7 eseguito dagli istituti nazionali di salute, USA, a titolo gratuito o a costi ridotti . È stato invitato da ONT a presentare parte di quel lavoro all'incontro di Londra Calling 2015 a Londra, Regno Unito, e ONT pagato per il trasporto e l'alloggio. Per il lavoro presentato in questo manoscritto non sono stati ottenuti benefici (ad es. hardware o reagenti a costi ridotti, rimborsi di viaggio, ecc.) da parte di ONT. AM, KF e RS non hanno nulla da rivelare.
Gli autori ringraziano Allison Groseth per la lettura critica del manoscritto. Questo lavoro è stato sostenuto finanziariamente dal Ministero federale tedesco dell'alimentazione e dell'agricoltura (BMEL) sulla base di una decisione del Parlamento della Repubblica federale di Germania attraverso l'Ufficio federale dell'agricoltura e dell'alimentazione (BLE).
Name | Company | Catalog Number | Comments |
1D2 adapter, barcode adapter mix, ABB buffer, elution buffer, RBF buffer, LBB beads | Oxford Nanopore Technologies | SQK-LSK308 | 1D² Sequencing Kit |
Blood collection tube with DNA/RNA stabilizing reagent | Zymo Research | R1150 | DNA/RNA Shield - Blood Collection Tube |
Blunt/TA ligase master mix | New England Biolabs | M0367S | Blunt/TA Ligase Master Mix |
DNA-low binding reaction tube | Eppendorf | 30108051 | DNA LoBind Tube |
DNase buffer and DNase | ThermoFisher Scientific | 11766050 | SuperScript™ IV VILO™ Master Mix with ezDNase™ Enzyme |
Flow cell | Oxford Nanopore Technologies | FLO-MIN105.24 | flow cell R9.4 |
Hot start high fidelity DNA polymerase | New England Biolabs | M0493L | Q5 Hot Start High-Fidelity DNA Polymerase (500 U) |
Magnetic beads | Beckman Coulter | A63881 | Agencourt AMPure XP beads |
Magnetic rack | ThermoFisher Scientific | 12321D | DynaMag-2 Magnet |
Nanopore sequencing device | Oxford Nanopore Technologies | - | MinION Mk 1B |
PCR barcoding kit | Oxford Nanopore Technologies | EXP-PBC001 | PCR Barcoding Kit I (R9) |
Reverse transcriptase master mix | ThermoFisher Scientific | 11766050 | SuperScript™ IV VILO™ Master Mix with ezDNase™ Enzyme |
RNA purification spin column, DNA/RNA prep buffer, DNA/RNA wash buffer, DNase I, DNA digestion buffer | Zymo Research | R1151 | Quick-DNA/RNA Blood Tube Kit |
Rotating mixer | ThermoFisher Scientific | 15920D | HulaMixer Sample Mixer |
Taq DNA polymerase | New England Biolabs | M0287S | LongAmp Taq 2x Master Mix |
Ultra II End-prep kit | New England Biolabs | E7546S | NEBNext Ultra II End-Repair/dA-tailing Modul |
UV spectrophotometer | Implen | - | NanoPhotometer |
Vacuum manifold | Zymo Research | S7000 | EZ-Vac Vacuum Manifold |
Richiedi autorizzazione per utilizzare il testo o le figure di questo articolo JoVE
Richiedi AutorizzazioneThis article has been published
Video Coming Soon