Method Article
Qui presentiamo un metodo di sequenziamento profondo che fornisce una determinazione obiettiva della nascente 3'-termini nonché profili mutational di molecole di DNA single-stranded. L'applicazione principale è la caratterizzazione del nascente retrovirali DNAs complementare (cDNA), gli intermedi generati durante il processo di trascrizione inversa retrovirale.
Monitoraggio di acido nucleico intermedi durante la replicazione del virus fornisce gli effetti e meccanismi d'azione di composti antivirali e proteine della cellula ospite: approfondimenti sulla sintesi del DNA virale. Qui affrontiamo la mancanza di un'analisi basata sulle celle, ad alta copertura e ad alta risoluzione che è in grado di definire la trascrizione inversa retrovirali intermedi all'interno del contesto fisiologico dell'infezione del virus. Il metodo descritto consente di acquisire le 3'-estremità delle molecole complementari nascente di DNA (cDNA) all'interno delle cellule di infezione da HIV-1 a risoluzione di singolo nucleotide. Il protocollo coinvolge raccolta dell'intera cellula del DNA, arricchimento mirato del DNA virale tramite ibrido cattura, legatura di adattatore, frazionamento di dimensione di purificazione del gel, amplificazione PCR, sequenziamento profondo e analisi dei dati. Un passo fondamentale è la legatura efficiente e imparziale delle molecole di adattatore per aprire termini 3'-DNA. Applicazione del metodo descritto determina l'abbondanza delle trascrizioni inversione di ogni lunghezza particolare in un dato campione. Fornisce anche informazioni circa la variazione di sequenza (interna) di trascrizioni inversione e quindi qualsiasi potenziali mutazioni. In generale, il dosaggio è adatto a tutte le domande relative al DNA 3'-estensione, purché la sequenza di modello è noto.
Per sezionare e capire la replicazione virale completamente, sempre più raffinate tecniche che catturano replica intermedi sono necessari. In particolare, la definizione precisa delle specie dell'acido nucleico virale all'interno del contesto delle cellule infettate può fornire nuove intuizioni, poiché molti meccanismi di replicazione virale hanno fino ad oggi è stato esaminato nelle reazioni isolate in vitro . Un primo esempio è il processo di trascrizione inversa nei retrovirus, come il virus dell'immunodeficienza umana 1 (HIV-1). I vari passaggi di trascrizione inversa di HIV-1, durante il quale il virale enzima transcriptase (RT) copia del genoma di single-stranded RNA in DNA double-stranded, sono stati studiati principalmente in saggi di estensione di primer con proteine purificate e acido nucleico acidi1,2,3,4,5. Mentre sono stati stabiliti i principi fondamentali, tali dosaggi non incorporano tutti i componenti virali e cellulari e potrebbero non riflettere stoichiometries biologicamente rilevanti dei fattori coinvolti. Pertanto, abbiamo progettato una tecnica potente per determinare gli spettri di trascrizione inversa intermedi con il loro preciso cDNA 3'-termini (cioè, determinare la loro esatte lunghezze) e sequenze del nucleotide nel contesto delle infezioni di vita le cellule6. Raccolta di dati da tempo esperimenti in corso possono essere utilizzati per confrontare il profilo di trascrizioni in varie condizioni, come la presenza di molecole antivirali o proteine, che possono influenzare l'efficienza e il processivity della sintesi del DNA e accumulo. Questo consente una comprensione più dettagliata del ciclo di vita naturale dell'agente patogeno, che è spesso la base per la progettazione di farmaci mirati e riuscito intervento terapeutico.
La trascrizione inversa di HIV-1 comprende una serie di eventi successivi iniziata da ricottura di un primer di tRNA per il modello di RNA genomico, che si è poi esteso da RT per produrre una breve filamento singolo cDNA trascrizione chiamata un filo meno forte-stop (-sss) (Vedi Figura 1). Successivamente, il cDNA - sss è trasferito dal terminal 5'-lungo ripetere (LTR) a 3'-LTR del RNA genomico, dove accoppia e serve come il primer per continuato RT mediato allungamento di meno filo del DNA (Vedi recensioni su trascrizione inversa1 , 2 , 3 , 4). questo primo trasferimento di filo è uno dei passaggi tasso-di limitazione di trascrizione d'inversione; quindi, il cDNA - sss è noto ad accumularsi. Il disegno di base del flusso di lavoro e biblioteca per catturare i prodotti di trascrizione inversa nelle cellule infette è descritta nella Figura 2a. I primers specifici e analisi le impostazioni che vengono utilizzate nel protocollo ed elencate nella tabella 1 destinazione tutti presto inversa trascrizione cDNA intermedi all'interno della gamma di lunghezza di 23 a ~ 650 nt, che comprende 180-182 nt - sss del DNA. Tuttavia, gli opportuni adattamenti minori alla strategia consentirà applicazione non solo fine trascrizione inversa prodotti, ma anche altri virus e sistemi, dove l'obiettivo è quello di rilevare le estremità del DNA contenente 3'-OH. Importanti limitazioni da considerare comprendono la gamma di lunghezza del prodotto PCR finale nella libreria; in particolare, modelli in cui la distanza tra l'adattatore sull'aperta 3'-terminale e il sito di primer a Monte superare ~ 1000 nt saranno probabilmente meno efficientemente sequenziati, introducendo potenzialmente ingannevoli pregiudizi tecnici durante libreria preparazione ( vedere la discussione per ulteriori dettagli e suggerimenti di adattamento).
Precedentemente segnalati tecniche per la determinazione sistematica di 3'-termini dei acidi nucleici sono concentrati su RNA e DNA, non molecole. Un esempio è 3' gara (amplificazione veloce delle estremità del cDNA)7, che si basa sulla poliadenilazione del mRNA. Inoltre, le strategie basate su legatura adattatore che impiegano ligasi di RNA sono state sviluppate, che hanno incluso RLM-RACE (gara di ligasi-mediata RNA)8 o pizzo (basato su legatura amplificazione del cDNA ends)9. È importante sottolineare che basati su legatura amplificazioni sono sensibili a qualsiasi distorsione introdotta dalla reazione di legatura si. Ad esempio, la legatura può essere più o meno efficiente a seconda di un particolare nucleotide in posizione 3', la sequenza, lunghezza totale molecola o struttura locale. Tali preferenze ligasi portano cattura incompleta delle molecole e travisamento nella lettura, che noi ed altri abbiamo osservato9,10. Per minimizzare il bias della legatura durante la procedura di aggiunta di adattatore nel protocollo descritto nel presente documento, abbiamo testato una serie di strategie di legatura e trovato l'uso di ligasi del DNA T4 con un adattatore di DNA single-stranded tornante (come descritto da Kwok et al. 11) di essere l'unica procedura con vicino la legatura quantitativa che non ha provocato le differenze significative in termini di efficienza legatura quando valutati con una serie di controllo oligonucleotidi6appositamente selezionati. La scelta di questa strategia di legatura è, dunque, una caratteristica fondamentale nel successo di questo protocollo.
Ad oggi, monitoraggio della progressione di RT di HIV-1 in cellule infettate principalmente è stata compiuta misurando prodotti trascrizione d'inversione, di varia lunghezza con PCR quantitativa (qPCR), utilizzo di set di primer-sonda che misura in modo univoco più o meno lunghi (precoce e tardi, rispettivamente) cDNA prodotti12,13,14. Mentre questo approccio qPCR è opportuno determinare l'efficienza intrinseca del processo di trascrizione inversa in sistemi cellulari, l'output è relativamente bassa risoluzione, senza informazioni di sequenza essendo derivata. Il nostro nuovo approccio, basato su adattatore ottimizzato la legatura, generazione della libreria PCR-mediata e indirizzi di sequenziamento profondo il divario tecnologico e offre la possibilità di monitorare la trascrizione d'inversione durante l'infezione da HIV-1 quantitativamente e a singolo nucleotide ad alta risoluzione.
Abbiamo illustrato l'utilità di questo metodo in uno studio che distingue tra due modelli proposti per la capacità del fattore di restrizione APOBEC3G di HIV-1 (enzima modifica catalitica polipeptide-come 3G del mRNA di apolipoproteina B) interferire con il produzione di trascrizioni virali inversa6.
Nota: Consultare la Tabella materiali per reagenti specifici e delle attrezzature utilizzate nel presente protocollo.
1. produzione virus e l'infezione delle cellule
Attenzione: Infettive HIV-1 deve essere gestita solo in laboratori di contenimento di biosicurezza approvato.
Nota: La produzione di particelle di HIV-1 mediante trasfezione transitoria di rene embrionale umano (HEK) 293T cellule, come descritto nel passo 1.1, sono una procedura standard ed sono stato descritto in precedenza15,16. Coltura cellulare generale le procedure sono descritte precedentemente17.
2. DNA estrazione, la quantificazione del DNA di HIV-1 e arricchimento di Hybrid Capture
3. adattatore legatura
4. adattatore rimozione e separazione dimensioni
5. PCR amplificazione e preparazione di biblioteca
6. valutare la libreria
7. high-Throughput sequenziamento Run
8. analisi dei dati
La tecnica descritta in questo articolo è stata applicata ad uno studio più ampio per affrontare i meccanismi di inibizione della trascrizione inversa di HIV-1 di proteina umana antiretrovirale APOBEC3G (A3G)6. La figura 3 Mostra i risultati rappresentativi ottenuti dopo che impiegano il protocollo in campioni da CEM-SS T-cellule infettate con vif-carenti HIV-1 in assenza o in presenza di A3G. Il numero totale di letture unici ottenuti da ogni campione dopo il filtraggio eventuali duplicati PCR che hanno la stessa 6 tracciati in Figura 3unnt codice a barre e la stessa lunghezza (cantata dal software di analisi fornito). I livelli aumentanti di A3G riducono il numero totale di lettura che riflette l'effetto inibitorio di A3G sulla RT mediato sintesi di cDNA precedentemente descritti e misurati da qPCR6,13,21,22. Nella Figura 3b, la frazione di molecole ad ogni possibile lunghezza all'interno del primo 182 nt sono mostrati. Infezione da HIV-1 in assenza di A3G, la specie più abbondante è il principale 180 nt forte-stop molecola stessa, con qualche accumulo di letture nella gamma più corta (23 a 40 nt) (istogrammi grafico, blu in alto). L'aggiunta di modifiche A3G che questo profilo come un forte incremento della più breve, troncato molecole di cDNA a poche posizioni molto specifici, riproducibile è rilevato (grafici di medio e Bassi). Poiché A3G è una citidina deaminasi, citosina-a-uridina (identificata come C-a-T) mutazioni nel cDNA verificano quando A3G è presente nelle infettante virioni21,23,24. Utilizzando le informazioni di sequenza ottenuta, la percentuale di mutazioni di C-a-T è stata tracciata sul grafico stesso (linea rossa tratteggiata). Dovrebbe essere notato che il profilo mutazionale deriva da letture tutti uniche combinate e copertura di ogni nucleotide varierà. Tuttavia, se richiesto informazioni di sequenza possono essere legati indietro ad ogni molecola e correlati con un specifico 3'-terminale. Sono stati considerati i dati forniti da Pollpeter et al. 6 e la correlazione tra mutazionale e profili di lunghezza di cDNA è stata dimostrata per essere dovuto il rilevamento e la fenditura di deaminated cDNA da cellulare macchine di riparazione del DNA.
Un controllo positivo per l'approccio di 3'-mappatura possa essere prodotte facilmente dalla lavorazione di un pool di oligonucleotidi sintetici di sequenza nota, la lunghezza e la concentrazione. Questo controllo viene aggiunto a legatura adattatore nel passaggio 3.3.2 e consigliato di essere incluso in tutte le librerie "multiplex". I dati ottenuti da un campione di controllo dovrebbero avere tutti gli oligonucleotidi ai rapporti di input previsti, con letture di sfondo solo molto minori. La figura 4 Mostra i risultati di un gruppo di controllo positivo di 17 oligonucleotidi sintetizzati chimicamente (per sequenze, vedere tabella 2), che sono stati miscelati a rapporti equimolari. Come previsto, tutte le molecole appaiono nel vicino uguale abbondanza con solo piccole variazioni (grafico in alto). Mentre la maggior parte delle posizioni all'interno della sequenza di DNA - sss che non erano rappresentate da un oligonucleotide restituire zero lettura conta, abbiamo osservato le specie minori che sono 1 o 2 nt inferiore i oligonucleotides di effettivo controllo. Ci non sono ulteriormente studiati queste specie minori ma si supponga che rappresentano prodotti degradati o incompleti potenzialmente presenti nelle scorte del oligonucleotide fornito al momento dell'acquisto (oligonucleotidi sono state ordinate come HPLC purificato, per il quale il produttore indica > 80% di purezza). Il grafico inferiore mostra il campione di controllo da un'altra libreria esegue, dove la variazione è leggermente più alto tra i 17 oligonucleotides e correla con la lunghezza totale in quanto più molecole di controllo vengono rilevati in modo più efficiente quindi più brevi. Questo può essere dovuto a una distorsione minore in reazioni di PCR o nel clustering durante la sequenza di MiSeq, che ha un optimum di dimensione inserto e può verificarsi con le librerie che trasportano gli intervalli particolarmente ampio inserto. Un modo di base per affrontare questa polarizzazione è l'applicazione di un fattore di normalizzazione basato sul pendio che indica il bias correlare alla lunghezza della molecola (linea rosa). I calcoli necessari sono inclusi nel programma di analisi (Vedi punto 8.3 nel protocollo).
Figura 1: diagramma che mostra i primi passi di HIV-1 retrotrascrizione. Il processo inizia con ricottura di tRNA(Lys,3) (arancione) per il sito di legame del primer (PBS) nel RNA genomico virale (passaggio 1), che permette l'avvio e l'allungamento del cDNA virale (blu, passaggio 2). Simultaneamente, il RNA genomico modello è degradato da RNaseH attività di RT (passaggio 3). Il primo intermedio completo nel processo di trascrizione inversa è la meno-filo forte fermata (-) sss cDNA, che è completa quando la polimerizzazione catalizzata RT raggiunge il 5'-capolinea dell'area (R) ripetuta gRNA (passaggio 3). Sss (-) intermedio viene trasferito al 3'-terminale del modello RNA genomico di ricottura per la regione (LTR) R di ripetizione terminale lunga 3' complementare. Da qui, polimerizzazione continua (passaggio 4). Nel metodo descritto la progressione di trascrizione d'inversione è determinata dal mapping la lunghezza esatta del cDNA virale nascente (blu). PPT, tratto polipurinico; U5, 5'-sequenza univoca; U3, 3'-sequenza unica. Questa figura è ripubblicata da una precedente pubblicazione6. Clicca qui per visualizzare una versione più grande di questa figura.
Figura 2 : Struttura di flusso di lavoro e gli schemi della legatura adattatore e strategia di amplificazione PCR. (a) flusso di lavoro che illustra i passi principali per la tecnica descritta per determinare 3'-termini di HIV-1 inversa le trascrizioni in cellule infettate. La figura è adattata da una precedente pubblicazione6. (b) schema della legatura di adattatore e strategia di amplificazione di PCR. Molecole di cDNA nascente di lunghezza variabile che sono stati purificati nei passaggi precedenti sono legati a un adattatore di DNA single-stranded utilizzando ligasi del DNA T4. L'adattatore di tornante (denominato "completo Kwok + MiSeq", Vedi tabella 1) design è stato ispirato da Kwok et al. 11. l'adattatore trasporta un casuale 6 sequenza di codici a barre nt, che consente per appaiamento per facilitare la legatura e contemporaneamente funge da identificatore per letture uniche. Le 3'-estremità dell'adattatore trasporta un distanziatore (SpC3) per evitare auto-legatura. Dei prodotti sono separati da adattatore in eccesso da denaturare elettroforesi del gel di poliacrilamide (pagina). Acidi nucleici nel gel sono macchiati e tagliati in tre pezzi separati, dimensioni uguali il gel nella zona da sopra l'adattatore al pozzo come fatto in25. Dopo eluizione, le precipitazioni e risospensione, i prodotti sono PCR amplificato con iniettori che temprano a sequenza nota dell'adattatore (primer 1, kit del oligonucleotide multiplex, Vedi Tabella materiali) e un primer che trasportano le prime 22 nt del HIV-1 Sequenza 5'-LTR immediatamente dopo il tRNA (primer 2, MP1.0 + 22). La 5'-termini dei primer selezionate portare adattatori per la piattaforma di sequenziamento selezionate (P5 e P7) così come una sequenza di indice per distinguere i singoli campioni eseguiti nella stessa libreria. Punti di partenza della sequenziazione leggere gli iniettori sono indicati. La scatola blu indica la regione di interesse per determinare le originale 3'-estremità della molecola catturata. Questa figura è adattata da una precedente pubblicazione6. Clicca qui per visualizzare una versione più grande di questa figura.
Figura 3 : Risultati rappresentativi. (a) il numero totale di lettura di campioni rappresentativi, trattati con il protocollo descritto. Questo include tutte le sequenze che sono state identificate come uniche letture di molecole di HIV-1 con loro 3'-termini entro il primo 635 nt di meno del cDNA del filo (fino al PPT, Vedi Figura 1). L'infezione con HIV-1 non trasportano A3G produce il maggior numero di letture, mentre A3G inibisce la sintesi del cDNA e quindi riduce il totale leggere totali. Le cellule non infette servito come controllo negativo, mentre un set di oligonucleotidi sintetici fornisce un controllo positivo. b) l'abbondanza relativa di cDNA per ogni lunghezza tra le posizioni di nt 23 e 182 (cDNA full-lenght - sss è 180-182 nt) l' HIV-1NL4.3 sequenza (asse x) è mostrato in blu istogrammi (scala sull'asse y di sinistra). L'abbondanza relativa di cDNA è stato calcolato dal numero assoluto di sequenze di terminazione a un nucleotide specificato all'interno della sequenza di cDNA - sss diviso per la somma di tutte le letture 182nt di misura o meno. Indicato nelle linee rosse tratteggiate sono le percentuali di letture che trasportano le mutazioni di C-a-T/U presso la rispettiva posizione (scala sugli assi y destra–). Figura 3 b viene ripubblicata da una precedente pubblicazione6. Clicca qui per visualizzare una versione più grande di questa figura.
Figura 4 : Risultati rappresentativi dei campioni di controllo. Vengono mostrati due profili per piscine contenenti quantità equimolari di 17 oligonucleotidi sintetici di diversa lunghezza. Questi oligonucleotidi sono sequenze da HIV-1NL4.3 e sono stati selezionati per coprire varie lunghezze e presentare tutte le 4 basi come un nucleotide 3' (cfr. tabella 2). Il grafico superiore mostra il campione di controllo positivo da Figura 3un. Nessuna significativa polarizzazione verso molecola lunghezza o le aperta 3'-estremità viene rilevato. Il grafico inferiore mostra un'altra libreria esegue, che ha prodotto una distorsione minore lunghezza in sequenza. In questo caso, si consiglia di applicare un fattore di normalizzazione, che è derivato dal versante (mostrato in rosa) che rappresenta la differenza di dimensioni. Questa figura è ripubblicata da una precedente pubblicazione6. Clicca qui per visualizzare una versione più grande di questa figura.
Nome di oligo | Lunghezza in nt | Sequenza | Scopo | Produttore (purificazione) | ||||||||||||||
Full Kwok + MiSeq | 61 | 5'-PHO-tgaagagcctagtcgctgttcannnnnnctgcccatagagagatcggaagagcacacgtct-SpC3-3' | Adattatore | Tecnologie del DNA IDT (HPLC) | ||||||||||||||
2xBiotin SS esca | 40 | 5'-biotina-cagtgtggaaaatctctagcagtggcgcccgaacagggac-biotina-3' | Hybrid Capture | MWG Eurofins (HPLC) | ||||||||||||||
Ss di biotina 1-16 | 22 | 5'-cagtgtggaaaatctctagcag-BiTEG-3' | Hybrid Capture | MWG Eurofins (HPLC | ||||||||||||||
Biotina tRNA + CTG | 16 | 5'-cagtggcgcccgaaca-BITEG-3' | Hybrid Capture | MWG Eurofins (HPLC) | ||||||||||||||
MP1.0 + 22 | 82 | 5'-aatgatacggcgaccaccgagatctacactctttccctacacgacgctcttccgatctcactgctagagattttccacactg-3' | Amplificazione di PCR | MWG Eurofins (HPLC |
Tabella 1: tabella dei oligonucleotides tra cui lunghezza, sequenze e le modifiche che vengono utilizzate nel protocollo descritto. La tabella è adattata da una precedente pubblicazione6. Per favore clicca qui per scaricare la tabella come file excel.
Nome di oligo | Lunghezza in nt | Sequenza | Produttore (purificazione) | |||||||||||||
HTP con lunga C | 120 | 5'-ctgctagagattttccacactgactaaaagggtctgagggatctctagttaccagagtcacacaacagacgggcacacactactttgagcactcaaggcaagctttattgaggcttaagc-3' | MWG Eurofins (HPLC) | |||||||||||||
HTP con lunga G | 119 | 5'-ctgctagagattttccacactgactaaaagggtctgagggatctctagttaccagagtcacacaacagacgggcacacactactttgagcactcaaggcaagctttattgaggcttaag-3' | MWG Eurofins (HPLC) | |||||||||||||
HTP con lunghe T | 116 | 5'-ctgctagagattttccacactgactaaaagggtctgagggatctctagttaccagagtcacacaacagacgggcacacactactttgagcactcaaggcaagctttattgaggctt-3' | MWG Eurofins (HPLC) | |||||||||||||
HTP raggiro A lungo | 118 | 5'-ctgctagagattttccacactgactaaaagggtctgagggatctctagttaccagagtcacacaacagacgggcacacactactttgagcactcaaggcaagctttattgaggcttaa-3' | MWG Eurofins (HPLC) | |||||||||||||
Con HTP metà C | 76 | 5'-ctgctagagattttccacactgactaaaagggtctgagggatctctagttaccagagtcacacaacagacgggcac-3' | MWG Eurofins (HPLC) | |||||||||||||
HTP con metà G (a) | 71 | 5'-ctgctagagattttccacactgactaaaagggtctgagggatctctagttaccagagtcacacaacagacg-3' | MWG Eurofins (HPLC) | |||||||||||||
HTP con metà G (b) | 72 | 5'-ctgctagagattttccacactgactaaaagggtctgagggatctctagttaccagagtcacacaacagacgg-3' | MWG Eurofins (HPLC) | |||||||||||||
Con HTP metà A | 69 | 5'-ctgctagagattttccacactgactaaaagggtctgagggatctctagttaccagagtcacacaacaga-3' | MWG Eurofins (HPLC) | |||||||||||||
Con HTP metà T | 85 | 5'-ctgctagagattttccacactgactaaaagggtctgagggatctctagttaccagagtcacacaacagacgggcacacactactt-3' | MWG Eurofins (HPLC) | |||||||||||||
HTP raggiro A breve | 40 | 5'-ctgctagagattttccacactgactaaaagggtctgaggga-3' | MWG Eurofins (HPLC) | |||||||||||||
HTP con breve T | 33 | 5'-ctgctagagattttccacactgactaaaagggt-3' | MWG Eurofins (HPLC) | |||||||||||||
HTP con breve G | 41 | 5'-ctgctagagattttccacactgactaaaagggtctgaggg-3' | MWG Eurofins (HPLC) | |||||||||||||
HTP con breve C | 34 | 5'-ctgctagagattttccacactgactaaaagggtc-3' | MWG Eurofins (HPLC) | |||||||||||||
HTP Con 46 (T) | 46 | 5'-ctgctagagattttccacactg actaaaagggtctgagggatctct-3' | MWG Eurofins (HPLC) | |||||||||||||
HTP Con 83 (C) | 83 | 5'-ctgctagagattttccacactg actaaaagggtctgagggatctctagttaccagagtcacacaacagacgggcacacactac-3' | MWG Eurofins (HPLC) | |||||||||||||
HTP Con 103 (C) | 103 | 5'-ctgctagagattttccacactg actaaaagggtctgagggatctctagttaccagagtcacacaacagacgggcacacactactttgagcactcaaggcaagc-3' | MWG Eurofins (HPLC) | |||||||||||||
HTP Con 107 (A) | 107 | 5'-ctgctagagattttccacactg actaaaagggtctgagggatctctagttaccagagtcacacaacagacgggcacacactactttgagcactcaaggcaagcttta-3' | MWG Eurofins (HPLC) |
Tabella 2: tabella di 17 oligonucleotidi di controllo sintetico usato come un campione di controllo positivo. I oligonucleotides 13 top sono stati scelti sulla base dimensioni [lungo (116-120 nt), mid (69-85 nt), breve (33-41 nt)] così come loro 3'-termini. La tabella è adattata da una precedente pubblicazione6. Per favore clicca qui per scaricare la tabella come file excel.
La disponibilità di sequenziamento profondo veloce, affidabile e conveniente ha rivoluzionato molti aspetti nel campo delle scienze della vita, consentendo grande profondità nelle analisi di sequenziamento. Un restante sfida il design innovativo e la creazione del rappresentante librerie di sequenziamento. Qui descriviamo un protocollo per catturare molecole di cDNA virale nascente, in particolare gli intermedi del processo di trascrizione inversa di HIV-1.
La fase più critica in questa strategia è la legatura di un adattatore per le aperte 3'-estremità in maniera quantitativa e imparziale. Efficienze di legature tra due termini di ssDNA, sia inter- e intramolecolari, sono stati studiati e ottimizzati per vari applicazioni11,26,27,28,29. La scelta di utilizzare un adattatore di tornante con T4 DNA ligasi nelle condizioni descritte al punto 3.3 è il risultato dell'ottimizzazione empirica in cui abbiamo valutato diverse ligasi, adattatori e reagenti per la legatura dei oligonucleotides sintetici che rappresentano Sequenze di HIV-1 (tabella 2) (dati non mostrati). In queste reazioni in vitro test, abbiamo confermato che la ligasi del DNA T4 mediato legatura dell'adattatore tornante, come descritto da Kwok et al. 11, ha una distorsione molto bassa e raggiunge vicino a legatura completa di molecole acceptor quando l'adattatore viene utilizzato in eccesso. L'efficienza di legatura era inalterata tramite l'aggiunta di sequenza nucleotidica per eseguire il rendering l'adattatore compatibile per il sistema multiplex primer (Vedi Figura 4). In confronto, abbiamo scoperto che una ligasi del DNA/RNA di termostabile 5' (Vedi "A-ligasi" Tabella materiali per esatte ligasi rispetto qui), che è una ligasi derivati dal RNA che è stata sviluppata in parte per migliorare l'efficienza di legatura con ssDNA come accettore 27, era infatti più efficace a legare due molecole di ssDNA di ligasi di RNA ("ligasi B"), ma aveva una distorsione significativa, con forti differenze di efficienza di legatura anche tra oligonucleotidi con differenze di lunghezza base singola [tabella 2 ; HTP con metà G (a) e (b)]. Inoltre, abbiamo trovato solo una minima distorsione in reazioni con "Ligasi C" combinato con un adattatore che trasportano un randomizzato 5'-termini (una strategia utilizzata per compensare la polarizzazione del nucleotide noto di "Ligasi C"; Vedi ad esempio Ding et al. 30). Tuttavia, la "ligasi C"-mediate intermolecolari legature erano incompleti, rendendo il sistema ligasi del DNA T4 la scelta migliore.
Diversi passaggi di controllo di qualità sopra il corso del protocollo e l'inclusione di controlli positivi e negativi permettono per la rilevazione dei potenziali problemi prima continuazione di dosaggio e forniscono indicazioni per la risoluzione dei sforzi. Le quantificazioni di qPCR ai punti 2.2.2 e 2.3.12 garantiscono che la quantità del materiale in ingresso è sufficiente. Numeri di copia cDNA tipico nella gamma di eluizione (dal punto 2.1) 200 µ l da circa 10.000 a 300.000 per µ l. Il passo di cattura di ibrido può comportare una perdita di HIV-1 complessivo cDNA quantità ma deve risultare in un forte arricchimento del cDNA di HIV-1 specifico su DNA cellulare, che può essere determinato utilizzando appositi primer per quantificare il DNA di genomic prima e dopo arricchimento di qPCR o misurando la concentrazione di DNA totale. Recuperati cDNA di HIV-1 dopo l'ibrido catturare passi dovrebbe essere almeno il 10% dell'input. Basso materiale di partenza può spiegare altrimenti un controllo positivo del oligonucleotide di successo (Vedi punto 3.3.2), ma solo limitato letture raggiunta nei campioni. Bassa legge numeri complessivi potrebbero essere spiegati anche da sovrastima della concentrazione libreria a causa della presenza di specie di DNA irrilevante senza adattatori MiSeq. Questo si tradurrebbe in densità bassa cluster e può essere migliorato determinando la concentrazione delle sequenze di HIV-1 nella libreria di qPCR oltre all'importo totale del DNA di analisi fluorometriche. A causa della natura altamente sensibile del metodo, si dovrebbe prestare particolare attenzione per evitare la contaminazione anche a basso livello, sia da altri campioni (in particolare, provenienti dalle scorte del oligonucleotide controllo alta concentrazione) così come da attrezzature di laboratorio. Lavorare in un UV sterilizzazione workstation PCR è utile a questo proposito. L'elettroforesi automatizzata della biblioteca finale (punto 6.1.2) è un'ulteriore misura di controllo di qualità. La gamma di dimensioni di acido nucleico in genere osservata è tra 150 e 500 nt. primer che può essere rilevato nel controllo facoltativo dopo la PCR, e prima di purificazione (Vedi nota al punto 5.2) dovrebbe essere assente. In un risultato rappresentativo, la curva di intensità di campione ha un picco circa 160-170 nt e un secondo più nitida picco circa 320 a 350 nt. Ciò probabilmente riflette l'abbondanza superiore spesso visto in sia relativamente breve (da 1 a 20 nt inserto) inversione trascritti e forte-fermata Full-Length (lunghezza di 180-182 nt inserto) (Figura 3b).
Mentre il protocollo presentato e selezionato gli iniettori sono specifici per primi costrutti di trascrizione inversa di HIV-1, il metodo è generalmente applicabile a qualsiasi studio con l'obiettivo di determinare aperti 3'-termini di DNA. Le principali modifiche richieste in altri contesti sarà il metodo per la cattura di ibrido e la strategia di disegno di primer. Ad esempio, se la destinazione è essere adattata alla fine trascrizioni di HIV-1, un numero maggiore di oligonucleotidi biotinilati diversi acquisizione ricottura su tutta la lunghezza del cDNA sarebbe consigliabile e probabilmente diminuirà la perdita nel passaggio cattura ibrida. Come accennato nell'introduzione, è importante considerare le limitazioni quando si progetta l'intervallo nel quale devono essere rilevato per evitare diverse fonti di bias 3'-stazione termini. Primo, ci può essere una distorsione nelle reazioni di PCR se i modelli con l'adattatore sono di lunghezza notevolmente variabile. In secondo luogo, la piattaforma di sequenziamento usata qui (per esempio, MiSeq) ha una gamma di lunghezza comodo inserto per il clustering ottimale, e significativamente più brevi e più a lunghi i prodotti non possono essere sequenziati con la stessa efficienza. In parte, questo può essere affrontato dal punto di vista, come è stato fatto calcolando il fattore di correzione per bias lunghezza lineare (Vedi Figura 4, grafico in basso). Tuttavia, se la regione di cui 3'-termini mappatura sono volute è lunga (> 1000 nt), è più consigliabile suddividere le reazioni con le trascrizioni dei e utilizzare più a Monte degli iniettori per valutare 3'-termini a sezioni.
Il programma di analisi è stato scritto in-House per lo scopo specifico di analizzare sia l'ultimo nucleotide della sequenza HIV-1 adiacente alla sequenza fissa adattatore così come la variazione di base di tutte le basi per identificare eventuali mutazioni. I singoli passaggi comprendono quanto segue: in primo luogo, le sequenze di adattatore vengono tagliate usando il toolkit fastx-0.0.13; quindi, vengono rimossi eventuali sequenze che vengono duplicate (cioè sequenze identiche tra cui il codice a barre). Tutte le rimanenti letture uniche quindi sono allineate alla sequenza di HIV-1 con Papillon (http://bowtie-bio.sourceforge.net/index.shtml) con il disallineamento massimo fissato a tre basi. La sequenza di modello è composto dal primo 635 nt del cDNA di HIV-1 (ceppo NL4.3), che comprende la sequenza - sss e il primo prodotto di trasferimento di filo fino alla pista di polipurinico (U5-R-U3-PPT; Vedi Figura 1). In tal modo, il software fornito e modelli sono direttamente adatti solo se il metodo viene utilizzato per la stessa applicazione (rilevazione delle trascrizioni precoce inversione del HIV-1NL4.3). Le regolazioni dovranno prevedere altre sequenze di destinazione. Le posizioni della 3'-termini per ogni lettura sono state determinate dalla posizione nell'allineamento. Chiamate di base per ogni posizione sono registrate e tassi di mutazione sono calcolati dalla copertura totale di ogni base, che varia, come letture sono di diverse lunghezze e inserti lunghi potrebbero non essere interamente coperti mediante il sequenziamento di 125-base in Read2.
Per concludere, riteniamo che il metodo descritto per essere uno strumento prezioso per molti tipi di studi. Ovvie applicazioni includono le indagini dei meccanismi che l'inibizione di trascrizione d'inversione attraverso farmaci antiretrovirali o fattori di restrizione cellulare. Tuttavia, solo relativamente piccoli aggiustamenti dovrebbero essere necessari adattare il sistema a 3'-termini mapping all'interno di altri singoli filamenti intermedi DNA virale, che sono presenti, ad esempio, nella replica di parvovirus. Inoltre, il principio del metodo, in particolare il suo passo di legatura ottimizzato, possa fornire una parte fondamentale della progettazione di preparazione di librerie per la caratterizzazione di eventuali estensioni di 3'-DNA, tra cui allungamenti catalizzati da cellulare DNA double-stranded polimerasi.
Gli autori dichiarano che non hanno nulla da rivelare.
Gli autori riconoscono il supporto dai membri del laboratorio Malim, Luis Apolonia, Jernej Ule e Rebecca Oakey. Gli autori ringraziano Matt Arno Centre Genomic del Re College di Londra e Debbie Hughes presso l'University College London (UCL), Istituto di neurologia successivo sequenziamento impianto di generazione, per aiuto con MiSeq l'ordinamento viene eseguito. Il lavoro è stato supportato da UK Medical Research Council (G1000196 e MR/M001199/1 a M.M.), il Wellcome Trust (106223/Z/14/Z a M.M.), settimo programma della Commissione europea quadro (FP7/2007-2013) sotto convenzione di sovvenzione non. PIIF-GA-2012-329679 (per D.P.) e il dipartimento della salute tramite un istituti nazionali per il premio salute ricerca Comprehensive Biomedical Research Center di Guy e St. Thomas' NHS Foundation Trust in collaborazione con College Londra del re e del re College Hospital NHS Foundation Trust.
Name | Company | Catalog Number | Comments |
293T cells | ATCC | CRL-3216 | |
Dulbecco's Modified Eagle's Medium | Gibco | 31966-021 | |
Penicillin/Streptomycin | Gibco | 15150-122 | |
Fetal Bovine Serum | Gibco | 10270-106 | |
HeraCell Vios 250i CO2 Incubator | Thermo Scientific | 51030966 | |
Laminar flow hood - CAS BioMAT2 | Wolflabs | CAS001-C2R-1800 | |
10mm TC-treated culture dish | Corning | 430167 | |
TrypLE™ Express (1x), Stable Trypsin Replacement Enzyme | Gibco | 12605-010 | |
OptiMEM® (Minimal Essential Medium) | Gibco | 31985-047 | |
HIV-1 NL4-3 Infectious Molecular Clone (pNL4-3) | NIH Aids reagent program | 114 | |
Polyethylenimine (PEI) - MW:25000 | PolySciences Inc | 23966-2 | dissolved at 1mg/ml and adjusted to pH7 |
RQ1- Rnase free Dnase | Promega | M6101 | |
Filter 0.22 μm | Triple Red Limited | FPE404025 | |
15 mL polypropylene tubes | Corning | CLS430791 | |
Sucrose | Calbiochem | 573113 | |
Phosphate Buffered Saline (1x) | Gibco | 14190-094 | |
Ultracentrifuge tubes | Beckman Coulter | 344060 | |
Ultracentrifuge | Sorval | WX Ultra Series | Th-641 Rotor |
Alliance HIV-1 p24 antigen ELISA kit | Perkin Elmer | NEK050001KT | |
CEM-SS cells | NIH Aids reagent program | 776 | |
Roswell Park Memorial Institute Medium | Gibco | 31870-025 | |
CoStar® TC treated multiple well plates | Corning | CLS3513-50EA | |
Benchtop centrifuge: Heraus™ Multifuge™ X3 FR | Thermo Scientific | 75004536 | |
TX-1000 Swinging Bucket Rotor | Thermo Scientific | 75003017 | |
Microcentrifuge: 5424R | Eppendorf | 5404000060 | |
Total DNA extraction kit (DNeasy Blood and Tissue kit) | Qiagen | 69504 | |
Nuclease free H2O | Ambion | AM9937 | |
Cutsmart buffer | New England Biolabs (part of DpnI enzyme) | R0176S | |
DpnI restriction enzyme | New England Biolabs | R0176S | |
Oligonucleotides for qPCR | MWG Eurofins | N/A | HPSF purification |
TaqMan PCR Universal Mastermix | Thermo | 4304437 | |
LoBind Eppendorf® tubes | Eppendorf | 30108078 | |
Axygen™ aerosol filter pipette tips, 1000 μL | Fisher Scientific | TF-000-R-S | |
Axygen™ aerosol filter pipette tips, 200 μL | Fisher Scientific | TF-200-R-S | |
Axygen™ aerosol filter pipette tips, 20 μL | Fisher Scientific | TF-20-R-S | |
Axygen™ aerosol filter pipette tips, 10 μL | Fisher Scientific | TF-10-R-S | |
PCR clean hood | LabCaire | Model PCR-62 | |
DynaMag™2-magnet | Thermo | 12321D | |
Streptavidin MagneSphere® paramagnetic particles | Promega | Z5481 | |
Casein | Thermo Scientific | 37582 | |
End over end rotator, Revolver™ 360° | Labnet | H5600 | |
Tris-Base | Fisher Scientific | BP152-5 | |
Hydrochloric Acid | Sigma | H1758-100ML | |
EDTA disodium salt dihydrate | Electran (VWR) | 443885J | |
Sodium Chloride | Sigma | S3014 | |
Dri-Block® Analog Block Heater | Techne | UY-36620-13 | |
PCR tubes and domed caps | Thermo Scientific | AB0266 | |
PCR machine | Eppendorf | Mastercycler® series | |
T4 DNA ligase | New England Biolabs | M0202M | |
40% Polyethylene glycol solution (PEG) in H2O, MW: 8000 | Sigma | P1458-25ML | |
Betaine solution, 5M | Sigma | B0300-1VL | |
Gel loading buffer II (formamide buffer) | Thermo Scientific | AM8546G | |
Precast 6% TBE urea gels | Invitrogen | EC6865BOX | |
Mini cell electrophoresis system | Invitrogen, Novex | XCell SureLock™ | |
Tris/Borate/EDTA solution (10x) | Fisher Scientific | 10031223 | |
Needle 21 G x1 1/2 | VWR | 613-2022 | |
SYBR Gold nucleic acid stain (10000x) | Life Technologies | S11494 | |
Dark Reader DR46B transilluminator | Fisher Scientific | NC9800797 | |
Ammonium acetate | Merck | 101116 | |
SDS solution 20% (w/v) | Biorad | 161-0418 | |
Centrifuge tube filter | Appleton Woods | BC591 | |
Filter Glass Fibre Gf/D 10mm | Whatman (VWR) | 512-0427 | |
polyadenylic acid (polyA) RNA | Sigma | 10108626001 | |
Glycogen, molecular biology grade | Thermo Scientific | R0561 | |
Isopropanol (2-propanol) | Fisher Scientific | 15809665 | |
Ethanol, molecular biology grade | Fisher Scientific | 10041814 | |
Accuprime™ Supermix I (DNA polymerase premix) | Life Technologies | 12342-010 | |
NEBNext® Multiplex Oligo for Illumina (Index Primer Set 1 and 2) | New England Biolabs | E7335S; E7500S | |
Tapestation D1000 Screentape High sensitivity | Agilent Technologies | 5067- 5584 | |
Tapestation D1000 Reagents | Agilent Technologies | 5067- 5585 | |
2200 Tapestation - automated gel electrophoresis system | Agilent Technologies | G2965AA | |
Agencourt® AMPure® beads XP | Beckman Coulter | A63880 | |
Qubit™ dsDNA HS Assay Kit | Invitrogen | Q32851 | |
Qubit™ 2.0 Fluorometer | Invitrogen | Q32866 | |
Topo™ TA cloning Kit | Invitrogen | 450071 | |
Sequencing platform: MiSeq System | Illumina | ||
Experiment Manager (Sample sheet software) | Illumina | Note: Use TruSeq LT as a template | |
Miseq™ Reagent kit V3 (150 cycle) | Illumina | MS-102-3001 | |
Sequencing hub: Basespace | Illumina | https://basespace.illumina.com | |
Ligase A: Thermostable 5’ App DNA/RNA ligase | NEB | M0319S | Not used in this protocol, but tested in optimization process with results described in the discussion. |
Ligase B: T4 RNA ligase 1 | NEB | M0204 | Not used in this protocol, but tested in optimization process with results described in the discussion. |
Ligase C: CircLigase | Epicentre | CL4111K | Not used in this protocol, but tested in optimization process with results described in the discussion. |
Richiedi autorizzazione per utilizzare il testo o le figure di questo articolo JoVE
Richiedi AutorizzazioneThis article has been published
Video Coming Soon