Method Article
* Questi autori hanno contribuito in egual misura
Elementi regolatori del DNA, come rinforzatori, controllano l'espressione genica contattando fisicamente i promotori di geni bersaglio, spesso attraverso interazioni a lungo raggio cromosomiche, che coprono grandi distanze genomiche. Promotore Capture Hi-C (PCHi-C) identifica interazioni significative tra promotori e regioni distali, che consente l'assegnazione di potenziali sequenze regolatrici a loro geni bersaglio.
L'organizzazione tridimensionale del genoma è legata alla sua funzione. Ad esempio, elementi regolatori come rinforzatori trascrizionali controllano l'espressione spazio-temporale dei loro geni bersaglio attraverso il contatto fisico, spesso colmare distanze genomiche considerevole (in alcuni casi centinaia di kilobasi) e bypassando geni vicini. Il genoma umano porti un stimato rinforzatori 1 milione, la maggior parte dei quali hanno sconosciuto geni bersaglio. Assegnazione regioni regolative distale ai loro geni bersaglio è dunque fondamentale per comprendere il controllo di espressione genica. Abbiamo sviluppato promotore Capture Hi-C (PCHi-C) per abilitare il rilevamento del genoma di regioni promotore-interacting distali (PIRs), per tutti i promotori in un singolo esperimento. In PCHi-C, altamente complesso Hi-C biblioteche specificamente sono arricchiti per sequenze promotrici attraverso selezione in soluzione ibrida con migliaia di esche biotinilati RNA complementari alle estremità dei frammenti di restrizione promotore-contenenti tutti. L'obiettivo è quello di sequenze promotrici poi discesa e i loro partner di frequente interazione come esaltatori e altri potenziali elementi regolatori. Dopo la sequenziazione di alto-rendimento accoppiato-fine, viene applicato un test statistico per ogni frammento di restrizione promotore-legati per identificare PIRs significativi a livello di frammento di restrizione. Abbiamo usato PCHi-C per generare un Atlante delle interazioni a lungo raggio promotore in decine di umani e tipi di cellule del mouse. Queste mappe Interactoma promotore hanno contribuito ad una maggiore comprensione del controllo di espressione genica dei mammiferi assegnando putative regioni regolative ai loro geni bersaglio e rivelando reti di interazione spaziale preferenziale promotore-promotore. Questa informazione ha anche alta rilevanza per la comprensione di malattie genetiche umane e l'identificazione di potenziali geni-malattia, collegando malattia-collegati non codificanti varianti a o vicino a sequenze di controllo a loro geni bersaglio di sequenza.
Raccogliendo la prova suggerisce che l'organizzazione tridimensionale del genoma svolge un importante ruolo funzionale in una gamma di processi nucleari, tra cui gene attivazione1,2,3, repressione4 ,5,6,7,8, ricombinazione9,10, DNA riparazione11, DNA replica12,13, e senescenza cellulare14. Esaltatori di distanti si trovano in prossimità spaziale ai promotori che regolano15,16,17, che è essenziale per il controllo di espressione genica spazio-temporale adeguato. Delezioni Enhancer mostrano che rinforzatori distali sono essenziali per destinazione gene trascrizione18,19,20,21,22e 'costretto cromatina loop' dimostra che derivati dal tethering tra un enhancer e relativo promotore di destinazione il locus Hbb è sufficiente per guidare l'attivazione trascrizionale23. Ulteriormente, le riorganizzazioni di genoma che portano geni sotto il controllo di esaltatori di ectopici possono causare l'attivazione del gene inappropriati e malattia24,25,26. Insieme, questi esempi illustrano che interazioni promotore-enhancer sono essenziali per il controllo del gene e richiedono regolazione stretta affinché l'espressione genica appropriato. L'essere umano e genomi del mouse sono stimati ciascuno per harbor esaltatori di circa 1 milione. Per la stragrande maggioranza di questi rinforzatori, geni bersaglio sono sconosciuti, e le regole di ingaggio tra promotori ed esaltatori di sapidità sono capite male. Assegnazione di esaltatori di transcriptional ai loro geni bersaglio così rimane una grande sfida nel decifrare il controllo di espressione genica dei mammiferi.
La nostra comprensione dell'architettura tridimensionale del genoma è stato rivoluzionato con l'introduzione di 3C27 (cattura di conformazione del cromosoma) e sue varianti28,29,30,31 . Il più potente di queste tecniche, Hi-C (cattura di conformazione di throughput elevato del cromosoma) è progettato per identificare l'intero ensemble di cromosomiche interazioni all'interno di una popolazione delle cellule. Hi-C biblioteche, tipicamente generati da milioni di cellule, sono molto complessi con un prodotti di legatura indipendente11 10 stimato tra frammenti di ~ 4 kb nel genoma umano32. Come una conseguenza, affidabile e riproducibile identificazione delle interazioni tra restrizione singoli frammenti (come quelle che contengono un promotore o enhancer) da Hi-C dati non sono fattibili, a meno che le librerie Hi-C sono sottoposti a sequenziamento ultra-profondo, che non è una soluzione economicamente conveniente per i laboratori di preparazione librerie Hi-C ordinariamente. Per ovviare a questo inconveniente, abbiamo sviluppato il promotore Capture Hi-C per arricchire in modo specifico promotore-contenente i prodotti di legatura da librerie Hi-C. Ci siamo concentrati sui promotori per due motivi. In primo luogo, contatti promotore-enhancer sono stati indicati per essere cruciale per i livelli di espressione di gene corretto nei numerosi studi (vedi riferimenti sopra), e in secondo luogo, come i promotori sono in gran parte invarianti tra tipi di cellule, lo stesso sistema di cattura dell'esca può essere utilizzato per interrogare il circuito di regolamentazione nei diversi tipi cellulari e condizioni. Il nostro approccio si basa sull'ibridazione nella soluzione delle librerie Hi-C con decine di migliaia di 120mers di biotinylated RNA complementare al promotore-contenente i prodotti di legatura Hi-C e successiva acquisizione su biglie magnetiche rivestite con streptavidina. Ciò si traduce in librerie PCHi-C con molto ridotta complessità rispetto alla libreria originale Hi-C, concentrandosi solo sull'identificazione di frammenti che sono legati ai promotori alle significativamente alte frequenze.
Abbiamo usato PCHi-C in un numero di umani e tipi di cellule del mouse di contribuire ad una migliore comprensione del controllo di espressione genica da scoprire regioni interagenti promotore distale a lungo raggio con funzione regolatrice putativo, come pure non casuale contatti di promotore-promotore nello spazio tridimensionale del nucleo. Gli studi hanno mappato centinaia di migliaia di contatti promotore-enhancer in tutto albergo numerose cellule tipi33,34,35,36,37,38, 39, identificato organizzazione genoma spaziale Polycomb Repressive Complex-mediata in cellule staminali embrionali di topo7, dimostrato ricablaggio su larga scala del promotore Interattomi durante la differenziazione cellulare37, 38 , 39e collegato non codificanti malattia-collegati di sequenza varianti a gene promotori35.
PCHi-C è un metodo ideale per mappare il genoma ensemble di sequenze di DNA che interagiscono con i promotori. Approcci correlati, ad esempio catturare Hi-C di regioni genomiche continue (Vedi discussione) sono il metodo di scelta per ottenere profili di interazione ad alta risoluzione per regioni genomiche selezionate. PCHi-C e catturare Hi-C sono estremamente simili da un punto di vista sperimentale (l'unica differenza è la scelta del sistema di cattura), così che i consigli e le linee guida che forniamo sono applicabili a entrambi gli approcci. Qui, presentiamo una descrizione dettagliata di PCHi-C. Delineare la spiegazione razionale e la progettazione di un esperimento di PCHi-C, forniamo un dettagliata PCHi-C protocollo di generazione in biblioteca e illustrare come la qualità delle librerie PCHi-C può essere monitorata a varie fasi nel protocollo per produrre dati di alta qualità.
1. formaldeide fissazione
2. lisi cellulare
3. hindIII digestione
4. Biotinylation delle sporgenze di frammento di restrizione
5. in-nucleo legatura
6. Crosslink inversione
7. purificazione di DNA
8. controlli di qualità
9. DNA frammentazione
10. selezione dimensione bifacciale SPRI-perlina
11. biotina/streptavidina Pull-down di legatura prodotti
12. fine riparazione e rimozione di biotina alle estremità del DNA di Non-legati
13. dATP Tailing
14. adattatore legatura
15. Ciao-C Library amplificazione
16. hybrid Capture In soluzione
Nota: Blocker e buffer (SHS1-4) soluzioni riportate di seguito sono dal SureSelect kit (Vedi Tabella materiali).
17. isolamento del promotore frammento-contenente prodotti di legatura
Nota: I passaggi seguenti sono raccomandati per essere fatto con kit adattatore SureSelect e biblioteca (Vedi Tabella di Materals).
18. PCHi-C Library amplificazione
Promotore Capture Hi-C è stato utilizzato per arricchire del mouse7,34,36,39 e umano33,35,37,38 Hi-C biblioteche per interazioni di promotore. Un simile protocollo (denominato HiCap) è stata descritta dal gruppo Sandberg40. Figura 1A Mostra il flusso di lavoro schematico per promotore Capture Hi-C. Nel protocollo descritto qui, librerie Hi-C sono generate tramite la legatura nel nucleo41, che si traduce in un numero significativamente ridotto di legatura spurie prodotti42. Per PCHi-C, mouse altamente complesso o librerie Hi-C umane sono sottoposti a nella soluzione di ibridazione e catturano utilizzando 39.021 biotinilati RNA complementare a frammenti di restrizione HindIII promotore-contenenti del mouse 22.225, o 37.608 biotinilati RNAs targeting 22.076 umano contenenti promotore HindIII frammenti di restrizione, rispettivamente. Promotore contenenti frammenti di restrizione possa essere mirati ad una o entrambe le estremità di singoli biotinilati RNAs (Figura 1B). Abbiamo trovato che la cattura di entrambi finisce copertura migliorata di singoli promotori (Figura 1; prime sequenze letture) quasi duplice, come previsto. Così, in ogni momento possibile (cioè, nelle regioni non-ripetitive), si consiglia di utilizzare biotinilati RNA complementare ad entrambe le estremità di un frammento di restrizione per essere catturato.
Per valutare la qualità biblioteca PCHi-C in una fase iniziale durante la preparazione della biblioteca, eseguiamo due controlli dopo legatura del DNA e purificazione, come descritto in precedenza31. Il primo consiste nell'utilizzare coppie di primer specifici per amplificare i prodotti di legatura come in 3 C27. Usiamo le coppie di primer (tabella 1) per amplificare i prodotti di cellula-tipo invariante legatura a lungo raggio, ad esempio tra il gene Myc e suoi esaltatori di noti si trova circa 2 Mb (Figura 2A) o tra geni del locus ( Hist1 separati da 1,5 Mb) e tra due regioni situate nelle immediate vicinanze lineare ('a corto raggio control').
Il secondo controllo di qualità è effettuato per determinare l'efficienza dell'incorporazione di biotina durante Fill-in di Klenow-mediata della restrizione sito strapiombi con biotina-dATP. Successo Klenow Fill-in e la legatura successiva smussato-fine risultati nella scomparsa del sito di restrizione originale tra le molecole di DNA di un prodotto di legatura e nel caso di HindIII nella formazione di un nuovo sito di riconoscimento NheI (Figura 2B ). Il rapporto tra il HindIII al prodotto digerito la legatura NheI è una lettura diretta dell'efficienza di incorporazione di biotina. Una libreria di Hi-C di scarsa qualità mostrerà un elevato livello di digestione HindIII, considerando che sono librerie di alta qualità vicino-completa NheI digestione dei prodotti di legatura (Figura 2B).
Dopo la preparazione di biblioteca Hi-C (vale a dire, dopo che la biotina-streptavidina tirare verso il basso della dimensione selezionata di prodotti di legatura Hi-C, adattatore legatura e pre-cattura PCR), la distribuzione l'integrità e la dimensione della libreria Hi-C è valutata da Bioanalyzer (Figura 2 C). lo stesso controllo viene effettuato alla fine della preparazione di libreria PCHi-C (vale a dire, dopo la cattura di ibridazione dei prodotti contenenti promotore di legatura e post-cattura PCR). Confronto dei profili Hi-C e C PCHi Bioanalyzer dimostra che come previsto, librerie Hi-C sono molto più concentrate rispetto le librerie corrispondenti PCHi-C, ma la distribuzione di dimensione delle librerie è molto simile, che indica che la cattura un passo in PCHi-C non introduce un bias di dimensione (Figura 2, D).
Dopo la sequenziazione accoppiato-fine, la legge di PCHi-C vengono mappata, qualità controllata e filtrata utilizzando il HiCUP della pipeline43. Alta qualità PCHi-C librerie contengono tra 70-90% 'coppie valide' (cioè, accoppiato-fine sequenza legga tra due frammenti di restrizione che non sono vicine sulla mappa genomica lineare; Figura 3A, B). Utilizzando la legatura nel nucleo protocollo41,42, la percentuale di trans legge coppie (cioè, accoppiato-fine sequenza legga tra due frammenti di restrizione che si trovano su cromosomi diversi) sono di solito basse, tra 5 e 25%, che riflette l'esistenza di territori cromosomici e che indica la qualità di buona biblioteca. Confronto diretto della percentuale di 'coppie valide' tra librerie Hi-C e i loro corrispondenti PCHi-C biblioteche35, spettacoli che in tutti i casi la percentuale di coppie valide è più alto nelle librerie PCHi-C (Figura 3B). Questo è accompagnato da una riduzione della percentuale di letture non valido 'stesso frammento interno' in PCHi-C (Figura 3). Questo è previsto, come il passo di cattura non solo arricchisce per prodotti contenenti promotore di legatura, ma anche per fini di frammento di restrizione, a causa della posizione della cattura i oligos sulla restrizione frammenti (Vedi Figura 1B).
Dopo HiCUP filtraggio, determiniamo l'efficienza di cattura. PCHi-C librerie contengono tre tipi di sequenza valida letture dopo il filtraggio di HiCUP:
1.) promotore: genoma legge (cioè, letture tra un frammento catturato promotore e un frammento di restrizione HindIII non-promotore ovunque nel genoma)
2.) promotore: promotore legge (letture tra due frammenti catturati promotore)
3.) genoma: genoma legge (prodotti di legatura di sfondo Hi-C dove nessuno dei partner di prodotto di legatura esegue il mapping a un promotore catturato). Queste vengono eliminate prima dell'analisi a valle.
Librerie di alta qualità PCHi-C hanno efficienze di cattura (somma delle categorie 1 e 2 sopra) tra 65-90% (Figura 3D). Un confronto diretto a librerie Hi-C Mostra che PCHi-C si traduce in una ~ 15 volte arricchimento per promotore-legatura prodotti contenenti (Figura 3D), in alcuni casi 17-fold. Questo è vicino al massimo ipotetico (19.6-fold) arricchimento per PCHi-C, che è dipendente la percentuale dei frammenti di restrizione di genoma coperte dal sistema di acquisizione. Maggiore arricchimento può essere ottenuta progettando sistemi di cattura mira meno restrizione frammenti44,45,46.
Analisi del promotore Interattomi dimostra cella tipo e specificità di lineage33,34,35, con cambiamenti pronunciati durante la differenziazione cellulare37,38,39 . Figure 4 e 5 mostrano esempi di dinamiche di specificità e differenziazione di lignaggio a promotori specifici. Ad esempio, ALAD è costitutivamente espressa in tutte le cellule, ma la sua espressione è upregulated in eritroblasti47. Il promotore ALAD contatti diversi frammenti distali in tutte le cellule ematopoietiche e si impegna in ulteriori interazioni specificamente negli eritroblasti (Figura 4). IL-8 non mostra nessuna interazione statisticamente significativa in cellule di B, molto poche interazioni in cellule di T, ma decine di interazioni in cellule della linea mieloide, comprese specifiche interazioni cellula-tipo in monociti, neutrofili e megacariociti ( Figura 5). Questi esempi dimostrano come PCHi-C può essere utilizzato per svelare Interattomi specifico tipo di cella e identificare regioni promotore-interagendo con potenziale normativo.
Figura 1 : Spiegazione razionale promotore Capture Hi-C e la cattura dell'esca design. Flusso di lavoro schematico (A) di PCHi-C. Nel nucleo la legatura Hi-C41,42 (I) è seguita dall'ibridazione nella soluzione con esche biotinilati RNA (II) targeting i frammenti di restrizione di tutto l'essere umano (qui raffigurato) o promotori di geni (III) il mouse. (B) esca design per PCHi-C. Biotinilati RNA cattura esche (linee curve rosse) sono destinate contro le estremità dei frammenti di restrizione promotore-contenenti (grigio; nota che le sequenze del promotore stessi (rosso) sono solo mirate dalle esche di cattura di RNA se essi si trovano a restrizione estremità del frammento). Prodotti di legatura costituito promotore contenenti frammenti di restrizione (grigi) e loro interagenti frammenti di restrizione (giallo e verde) sono isolati mediante ibridazione di sequenza-complementarità tra esca di RNA e DNA bersaglio e successive biotina-streptavidina pulldown, come mostrato in a. (C) confronto di PCHi-C l'efficienza di cattura per promotore contenenti frammenti di restrizione mirati da un RNA esca cattura sonda vs due sonde di RNA esca cattura (Vedi schema b). Clicca qui per visualizzare una versione più grande di questa figura.
Figura 2 : Controlli di qualità di pre-sequenza PCHi-C. (A) a sinistra, schema di contrapposizione spaziale tra promotore e PIR con conseguente Hi-C legatura prodotto costituito da un frammento di restrizione promotore-contenenti (grigio; sequenza del promotore in rosso) e un frammento di restrizione del PIR (giallo). Diritto, DNA elettroforesi mostrando esempi di Hi-C legatura prodotti amplificati utilizzando coppie di primer specifici (come raffigurato nello schema a sinistra). (B) a sinistra, esempi rappresentativi di restrizione HindIII, NheI e HindIII/NheI digerisce di Hi-C legatura (prodotti PCR mostrato nella A). Bene, disegno schematico del DNA sequenza dopo legatura Hi-C seguito infruttuoso (in alto) o Fill-in Klenow di dNTP successo (in basso) di giunzioni di restrizione e la legatura successiva. (C) rappresentante Hi-biblioteca bioanalyzer il profilo C (diluizione 1/5). Profilo bioanalyzer rappresentante PCHi-C biblioteca di (D) (Nessuna diluizione). Clicca qui per visualizzare una versione più grande di questa figura.
Figura 3 : Controlli di qualità post-sequenziamento PCHi-C. (A) confronto di sequenza valida percentuale legga le coppie dopo HiCUP43 elaborazione a PCHi-C vs corrispondenti librerie Hi-C (dati da Javierre et al., 201635). (B) risultato rappresentante HiCUP PCHi-C risultati validi legge coppie e altre categorie di sequenza che vengono eliminate prima dell'analisi a valle (dati da Javierre et al., 201635). (C) confronto della percentuale 'stesso frammento interno' legge dopo HiCUP elaborazione a PCHi-C vs corrispondenti librerie Hi-C (dati da Javierre et al., 201635). (D) confronto di sequenza percentuale legge frammenti innescati promotore che coinvolgono (efficienza di cattura) a PCHi-C vs corrispondenti librerie Hi-C (dati da Javierre et al., 201635). Clicca qui per visualizzare una versione più grande di questa figura.
Figura 4: ALAD profilo PCHi-C in cellule ematopoietiche umane. Interazioni di promotore di tipi delle cellule mieloidi sono mostrati come archi blu, e interazioni di promotore di tipi delle cellule linfoidi come archi viola. Interazioni dell'eritroblasto specifiche sono indicati dalle frecce rosse (dati da Javierre et al., 201635). Clicca qui per visualizzare una versione più grande di questa figura.
Figura 5 : IL8 Profilo di PCHi-C in cellule ematopoietiche umane. Interazioni di promotore di tipi delle cellule mieloidi sono mostrati come archi blu, e interazioni di promotore di tipi delle cellule linfoidi come archi viola. Interazioni del monocito-specifiche sono indicati dalle frecce verdi, interazioni del neutrofilo-specifiche sono indicati dalle frecce rosse e un'interazione megacariocita specifico è indicata da una freccia marrone (dati da Javierre et al., 201635). Clicca qui per visualizzare una versione più grande di questa figura.
Umano | ||||||||
Nome | Sequenza | Cromosoma | Strand | Inizio GRCh38/hg38 | Fine GRCh38/hg38 | Combinazioni di primer per testare 3C interazioni e incorporazione di biotina | ||
HS AHF64 Dekker | GCATGCATTAGCCTCTGCTGTTCTCTGAAATC | 11 | + | 116803960 | 116803991 | utilizzare in combinazione con hs AHF66 Dekker | ||
HS AHF66 Dekker | CTGTCCAAGTACATTCCTGTTCACAAACCC | 11 | + | 116810219 | 116810248 | utilizzare in combinazione con hs AHF64 Dekker | ||
locus MYC HS | GGAGAACCGGTAATGGCAAA | 8 | - | 127733814 | 127733833 | utilizzare in combinazione con hs MYC + 1820 o hs MYC-538 | ||
HS MYC + 1820 | AAAATGCCCATTTCCTTCTCC | 8 | + | 129554527 | 129554547 | utilizzare in combinazione con locus MYC hs | ||
HS MYC-538 | TGCCTGATGGATAGTGCTTTC | 8 | - | 127195696 | 127195716 | utilizzare in combinazione con locus MYC hs | ||
HS HIST1 F | AAGCAGGAAAAGGCATAGCA | 6 | + | 26207174 | 26207193 | utilizzare in combinazione con hs HIST1 R | ||
HS HIST1 R | TCTTGGGTTGTGGGACTTTC | 6 | + | 27771575 | 27771594 | utilizzare in combinazione con hs HIST1 F | ||
Mouse | ||||||||
Sequenza | Cromosoma | Strand | Inizio GRCm38/mm10 | Fine GRCm38/mm10 | Combinazioni di primer per testare 3C interazioni e incorporazione di biotina | |||
TCATGAGTTCCCCACATCTTTG | 8 | + | 84841090 | 84841111 | utilizzare in combinazione con mm Calr2 | |||
CTGTGGGCACCAGATGTGTAAAT | 8 | + | 84848519 | 84848541 | utilizzare in combinazione con mm Calr1 | |||
TATCAAGGGTGCCCGTCACCTTCAGC | 6 | + | 125163098 | 125163123 | utilizzare in combinazione con Gapdh4 Dekker | |||
GGGCTTTTATAGCACGGTTATAAAGT | 6 | + | 125163774 | 125163799 | utilizzare in combinazione con Gapdh3 Dekker | |||
GGAGGAGGGAAAAGGAGTGATT | 6 | + | 52212829 | 52212850 | utilizzare in combinazione con mm Hoxa13 | |||
CAGGCATTATTTGCTGAGAACG | 6 | - | 52253490 | 52253511 | utilizzare in combinazione con mm Hoxa7 | |||
GGGTAATGGTGTCACTAACTGG | 13 | + | 23571284 | 23571305 | utilizzare in combinazione con Hist1h3e o mm Hist1h4i | |||
GGGTTTGATGAGTTGGTGAAG | 13 | + | 23566541 | 23566561 | utilizzare in combinazione con mm Hist1h2ae | |||
TTGGGCCAAAGCCTATATGA | 13 | + | 22043085 | 22043104 | utilizzare in combinazione con mm Hist1h2ae |
Tabella 1: Sequenze Primer per il controllo di qualità di essere umano e le librerie del mouse Hi-C.
Design modulare del promotore Capture Hi-C
Promotore Capture Hi-C è progettato per arricchire in particolare librerie Hi-C per le interazioni che coinvolgono i promotori. Queste interazioni comprendono solo un sottoinsieme di legatura prodotti presenti in una libreria di Hi-C.
Cattura Hi-C può essere facilmente modificato per arricchire le librerie Hi-C per qualsiasi regione genomica o regioni di interesse modificando il sistema di acquisizione. Cattura regioni possono essere continuo segmenti genomici44,45,46,48, esaltatori di che sono stati identificati in PCHi-C ('Reverse Capture Hi-C'35), o dnasi I siti ipersensibili49 . La dimensione del sistema di acquisizione può essere regolata a seconda dell'ambito sperimentale. Ad esempio, Dryden et al. destinazione 519 esca frammenti nei tre deserti di gene associati al seno cancro44. Il sistema di acquisizione da Martin et al. gli obiettivi di entrambi i segmenti genomici continui ('Regione Capture': 211 regioni genomiche in totale; 2.131 frammenti di restrizione) e selezionato promotori (3.857 promotori di geni)45.
SureSelect librerie sono disponibili in dimensioni diverse gamme: 1 kb per 499 kb (5.190 – 4.806), 500 kb a 2,9 Mb (5.190 – 4.816) e 3 Mb a 5,9 Mb (5.190 – 4.831). Come ogni acquisizione singola biotina-RNA è 120 nucleotidi lunghi, queste acquisizione sistemi di ospitare un massimo di 4.158, 24.166 e 49.166 individuali cattura sonde, rispettivamente. Ciò corrisponde a 2.079, 12.083 e 24.583 frammenti di restrizione mirata, rispettivamente (si noti che i numeri per i frammenti di restrizione sono limiti inferiori basati sul presupposto che le due sonde di acquisizione singola possono essere progettati per ogni restrizione frammento — in realtà a causa di sequenze ripetitive questo non sarà il caso per ogni restrizione frammento (Vedi anche Figura 1B, C), determinando un maggior numero di frammenti di restrizione indirizzabile per un numero costante di acquisizione disponibili sonde ).
Il protocollo qui descritto si basa sull'uso di un enzima di restrizione con un sito di riconoscimento bp 6 per scoprire interazioni a lungo raggio. Usando un enzima di restrizione con un sito di riconoscimento bp 4 per una maggiore risoluzione delle interazioni più prossimale è anche possibile40,49.
Limitazioni di PCHi-C
Un limite intrinseco di ogni cromosoma conformazione cattura saggi è che la loro risoluzione è determinata con l'enzima di restrizione utilizzato per la generazione della libreria. Interazioni che avvengono tra elementi di DNA situati sullo stesso frammento di restrizione sono invisibili per analisi di 'tipo C'. Ulteriormente, in PCHi-C, in alcuni casi più di un sito di inizio della trascrizione possa trovarsi sullo stesso frammento di restrizione contenenti promotore, e PIRs in alcuni casi porto entrambi i contrassegni istone attivo e repressiva, che lo rende difficile individuare quale regolamentazione elementi di mediano le interazioni e di prevedere l'output regolamentazione delle interazioni del promotore. Usando gli enzimi di restrizione con 4 siti di riconoscimento di bp attenua questo problema ma a scapito di molto maggiore complessità di biblioteca Hi-C (Hi-C biblioteche generate con 4 degli enzimi di restrizione del sito di riconoscimento di bp sono almeno 100 volte più complessi di Hi-C le librerie generate con 6 degli enzimi di restrizione del sito di riconoscimento di bp) e i costi associati per il sequenziamento di nuova generazione.
Un'altra limitazione è che l'attuale protocollo di PCHi-C richiede milioni di cellule come materie prime, precludendo l'analisi delle interazioni di promotore in tipi cellulari rara. Una versione modificata di PCHi-C per attivare l'interrogatorio di contatti promotore in popolazioni di cellule con 10.000 a 100.000 cellule (ad esempio cellule durante lo sviluppo embrionale precoce o di cellule staminali ematopoietiche) sarebbe pertanto una preziosa aggiunta alla cattura Hi-C della casella degli strumenti.
Infine, come tutti i metodi che si basano sulla fissazione di formaldeide, PCHi-C registra solo le interazioni che sono 'congelate' presso il punto di tempo di fissazione. Così, per studiare la cinetica e la dinamica delle interazioni di promotore, metodi come microscopia di Super-risoluzione cellule vive sono tenuti insieme a PCHi-C.
Metodi di sezionare l'organizzazione spaziale del cromosoma ad alta risoluzione
La complessità vasta delle librerie di interazione cromosomiche vieta l'identificazione affidabile di prodotti di interazione tra due frammenti di restrizione specifici con significatività statistica. Per aggirare questo problema, acquisizione di sequenza è stato utilizzato per arricchire o Hi-C33,34,40,44 o 3 C50,51 librerie per interazioni specifiche. Il principale vantaggio dell'utilizzo di librerie librerie oltre 3C Hi-C per la fase di arricchimento è che Hi-C, a differenza di C 3, include una fase di arricchimento per i prodotti genuini di legatura. Di conseguenza, la percentuale di legge valide in librerie PCHi-C è di circa 10 volte superiore a quella in Capture-C biblioteche50, che conteneva circa 5 – 8% valido legge dopo il filtraggio di HiCUP. Serifoski et al hanno confrontato direttamente cattura-C a HiCap, che come PCHi-C utilizza librerie Hi-C per l'arricchimento di cattura, in contrasto con Capture-C che utilizza librerie C 3. Coerente con i nostri risultati, hanno trovato che cattura-C biblioteche sono costituiti principalmente da frammenti ONU-dei40. Inoltre, le librerie HiCap avevano una complessità maggiore di cattura-C biblioteche40.
Una variante di cattura-C, chiamato generazione cattura-C52 (NG cattura-C) utilizza un oligo al fine di frammento di restrizione, come precedentemente stabilito in PCHi-C33,34, invece che sovrapposte sonde utilizzate nell'originale Protocollo di acquisizione-C50. Questo aumenta la percentuale di letture valide rispetto all'acquisizione-C modestamente, ma NG cattura-C impiega due turni sequenziale di arricchimento di cattura, e un numero relativamente elevato di PCR cicli (cicli di 20-24 in totale, rispetto a 11 cicli in genere per PCHi-C), che inevitabilmente si traduce in più alti numeri di sequenza duplicati e minore complessità di biblioteca. In esperimenti di prova durante l'ottimizzazione di PCHi-C, abbiamo trovato che la percentuale di unico (cioè, non duplicati) legge coppie era solo circa 15% quando abbiamo usato 19 cicli di PCR (13 cicli pre-capture + 6 cicli post-acquisizione; dati non indicati), tuttavia ottimizzazione di un minor numero di cicli di PCR, in genere produce 75 – 90% coppie di lettura uniche. Quindi, riducendo il numero di cicli di PCR sostanzialmente aumenta la quantità di dati di sequenza informativa.
Un metodo recente combina ChIP con Hi-C di concentrarsi sulle interazioni cromosomiche mediati da una proteina specifica di interesse (HiChIP53). Rispetto alla ChIA-PET54, che si basa su una logica simile, HiChIP dati contengano un numero maggiore di letture di sequenza informativo, consentendo l'interazione maggiore fiducia chiamando53. Sarà molto interessante confrontare direttamente il corrispondente HiChIP e insiemi di dati di cattura Hi-C una volta che diventano disponibili (ad esempio HiChIP usando un anticorpo contro la coesina unità Smc1a53 con Capture Hi-C per tutti i Smc1a associato restrizione frammenti) fianco a fianco. Una differenza intrinseca tra questi due approcci è che catturare Hi-C non si basa su immunoprecipitazione della cromatina e pertanto è in grado di interrogare cromosomiche interazioni indipendentemente dall'occupazione di proteina. In questo modo il confronto dell'organizzazione del genoma 3D in presenza o in assenza di specifico fattore legante, come è stato utilizzato per identificare PRC1 come regolatore chiave del mouse ESC genoma spaziale architettura7.
PCHi-C e GWAS
Studi di associazione genome-wide (GWAS) hanno rivelato che superiore al 95% della malattia-collegati varianti di sequenza si trovano in regioni non codificanti del genoma, spesso a grandi distanze di proteina-codificazione geni55. Varianti di GWAS sono spesso trovati in prossimità di dnasi I siti ipersensibili, che è un segno distintivo delle sequenze con potenziale attività regolatoria. PCHi-C e catturare Hi-C sono stati ampiamente utilizzati per collegare i promotori ai loci GWAS rischio implicati nel cancro di seno44, cancro colorettale48e malattia autoimmune35,45,46. Un PCHi-C studio su 17 cellule ematopoietiche umane differenti tipi trovano SNPs associati con la malattia autoimmune sono stati arricchiti in PIRs in cellule linfoidi, mentre varianti di sequenza associate tratti specifici delle piastrine e globuli rossi sono stati trovati principalmente in i macrofagi ed eritroblasti, rispettivamente35,56. Così, promotore specifico tessuto tipo Interattomi scoperto da PCHi-C possono aiutare a capire la funzione della malattia-collegati non codificanti varianti di sequenza e identificare nuovi geni malattia potenziale per intervento terapeutico.
Caratteristiche delle regioni promotore-interagire
Parecchie linee di prova link promotore Interattomi a controllo di espressione genica. In primo luogo, parecchi PCHi-C studi hanno dimostrato che le regioni genomiche che interagiscono con i promotori di geni espressi (altamente) sono arricchite in segni associati con attività di enhancer, come H3K27 acetilazione e p300 associazione33,34 , 37. abbiamo trovato una correlazione positiva tra livello di espressione genica e il numero di rinforzatori interagenti, suggerendo che gli effetti additivi di risultato rinforzatori in aumentata espressione genica livelli34,35. In secondo luogo, di origine naturale espressione loci quantitative trait (QTLs) sono arricchiti in PIRs connessi agli stessi geni cui espressione è influenzata dal QTLs35. In terzo luogo, integrando dati PCHi-C e viaggio57 , Cairns et al trovato che geni reporter di viaggio mapping a PIRs in mouse CES mostrano reporter più forte espressione genica di geni reporter presso siti di integrazione nelle regioni non-interagenti promotore 58, che indica che il PIRs possiedono attività trascrizionale di regolamentazione. Insieme, questi risultati suggeriscono che il promotore Interattomi scoperti da PCHi-C in vari tipi di cellule umane e del mouse includono moduli regolatori chiave per controllo di espressione genica.
Vale la pena notare che i rinforzatori rappresentano solo una piccola frazione (~ 20%) di tutte le PIRs scoperto da PCHi-C33,34. Altri PIRs potrebbe avere ruoli strutturali o topologici anziché funzioni di regolamentazione trascrizionale dirette. Tuttavia, c'è anche prova che PCHi-C può svelare elementi di DNA con funzione regolatrice che non porto classica enhancer marchi. In una linea di cellule linfoidi umane, il promotore di BRD7 è stato trovato per interagire con una regione priva di segni di enhancer che è stata indicata per possedere l'attività enhancer in reporter gene saggi33. Elementi regolatori con caratteristiche simili possono essere più abbondanti che attualmente apprezzato. Ad esempio, una schermata basata su CRISPR per DNA elementi identificati contrassegno normativi elementi regolatori (UREs) che controllano l'espressione genica, ma sono privi del rinforzatore segna59.
In altri casi, PIRs hanno dimostrato di marchi di cromatina associate di repressione trascrizionale del porto. PIRs e interagenti promotori vincolati PRC1 in mouse CES erano impegnati in una vasta rete spaziale dei geni repressi recanti che il repressivo Marco H3K27me37. In cellule linfoblastoidi umane, un elemento distante interagendo con il promotore di BCL6 represso transgene reporter gene espressione33, suggerendo che potrebbe funzionare per reprimere la trascrizione di BCL6 nel suo contesto nativo.
PIRs arricchiti per occupazione della proteina isolante della cromatina CTCF umano CES e NECs37 può rappresentare un'altra classe di PIRs. Collettivamente, questi risultati suggeriscono che il PIRs harbor una raccolta di attività di regolamentazione gene ancora ad essere funzionalmente caratterizzato.
Gli autori non hanno nulla a rivelare.
Ringraziamo Valeriya Malysheva per lettura critica del manoscritto e aiuto di esperti con la figura 1. Questo lavoro è stato supportato dal Medical Research Council, UK (MR/L007150/1) e UK Biotechnology and Biological Sciences Research Council, UK (BB/J004480/1).
Name | Company | Catalog Number | Comments |
16% (vol/vol) paraformaldehyde solution | Agar Scientific | R1026 | |
Dulbecco's Modified Eagle Medium (DMEM) 1x | Life Technologies | 41965-039 | |
Fetal bovine serum (FBS) sterile filtered | Sigma | F9665 | |
Low-retention filter tips | Starlab | S1180-3810, S1180-1810, S1180-8810 and S1182-1830 | |
10x PBS pH 7.4 | Life Technologies | 70011-036 | |
Molecular biology grade water | Sigma-Aldrich | W4502 | |
1 M Tris-HCl pH 8.0 | Life Technologies | 15568-025 | |
IGEPAL CA-630 | Sigma-Aldrich | I8896 | |
5 M NaCl | Life Technologies | 24740-011 | |
Protease inhibitor cocktail (EDTA-free) | Roche Diagnostics | 11873580001 | |
Restriction buffer 2 (10x NEBuffer 2) | New England Biolabs | B7002 | |
DNA LoBind tube, 1.5 mL | Eppendorf | 0030 108.051 | |
DNA LoBind tube, 2 mL | Eppendorf | 30108078 | |
20% (wt/vol) SDS | Bio-Rad Laboratories | 161-0418 | |
20% (vol/vol) Triton X-100 | Sigma-Aldrich | T8787 | |
HindIII, 100 U/uL | New England Biolabs | R0104 | |
10 mM dCTP | Life Technologies | 18253-013 | |
10 mM dGTP | Life Technologies | 18254-011 | |
10 mM dTTP | Life Technologies | 18255-018 | |
0.4 mM Biotin-14-dATP | Life Technologies | 19524-016 | |
DNA polymerase I large (Klenow) fragment 5000 units/mL | New England Biolabs | M0210 | |
10x T4 DNA ligase reaction buffer | New England Biolabs | B0202 | |
100x 10mg/ml Bovine Serum Albumin | New England Biolabs | B9001 | |
T4 DNA ligase, 1 U/μL | Invitrogen | 15224-025 | |
RNase A | Roche | 10109142001 | |
Proteinase K, recombinant, PCR grade | Roche | 3115836001 | |
20 000×g 50 ml centrifuge tube | VWR | 525-0156 | |
0.5 M EDTA pH 8.0 | Life Technologies | 15575-020 | |
Phenol pH 8.0 | Sigma | P4557 | |
Phenol: Chloroform: Isoamyl Alcohol 25:24:1 | Sigma | P3803 | |
Sodium acetate pH 5.2 | Sigma | S7899 | |
Quant-iT PicoGreen | Invitrogen | P7589 | |
QIAquick Gel Extraction Kit | Qiagen | 28704 | |
QIAquick PCR Purification Kit | Qiagen | 28104 | |
Restriction buffer 2.1 (10x NEBuffer 2.1) | New England Biolabs | B7202 | |
NheI, 100U/uL | New England Biolabs | R0131 | |
Micro TUBE AFA Fiber Pre-slit snap cap 6x16mm vials | Covaris | 520045 | For sonication |
SPRI beads (Agencourt AMPure XP) | Beckman Coulter | A63881 | |
Dynabeads MyOne Streptavidin C1 beads | Invitrogen | 65001 | |
Tween 20 | Sigma | P9416 | |
10 mM dATP | Life Technologies | 18252-015 | |
T4 DNA polymerase 3000 units/mL | New England Biolabs | M0203 | |
T4 PNK 10000 units/mL | New England Biolabs | M0201 | |
Klenow exo minus 5000 units/mL | New England Biolabs | M0212 | |
Quick ligation reaction buffer | New England Biolabs | B6058 | |
NEB DNA Quick ligase | New England Biolabs | M2200 | |
PE adapter 1.0 (5'-P-GATCGGAAGAGCGGTTCAGC AGGAATGCCGAG-3') | Illumina | ||
PE adapter 2.0 (5'-ACACTCTTTCCCTACACGACGCT CTTCCGATCT-3') | Illumina | ||
NEB Phusion PCR kit | New England Biolabs | M0530 | |
PE PCR primer 1.0 (5'-AATGATACGGCGACCACCGA GATCTACACTCTTTCCCTAC ACGACGCTCTTCCGATCT-3') | Illumina | ||
PE PCR primer 2.0 (5'-CAAGCAGAAGACGGCATACGA GATCGGTCTCGGCATTCCT GCTGAACCGCTCTTCCGATCT-3') | Illumina | ||
PCR strips | Agilent Technologies | 410022 and 401425 | |
SureSelect SSEL TE Reagent ILM PE full adaptor kit | Agilent Technologies | 931108 | |
SureSelect custom 3-5.9 Mb library | Agilent Technologies | 5190-4831 | custom design mouse or human PCHi-C system |
Dynabeads MyOne Streptavidin T1 beads | Invitrogen | 65601 | |
E220 high-performance focused ultra-sonicator | Corvaris | E220 |
Richiedi autorizzazione per utilizzare il testo o le figure di questo articolo JoVE
Richiedi AutorizzazioneThis article has been published
Video Coming Soon