Method Article
I domini intrinsecamente disordinati sono importanti per la funzione del fattore di trascrizione di fusione oncogenica. Per indirizzare terapeuticamente queste proteine, è necessaria una comprensione più dettagliata dei meccanismi di regolazione impiegati da questi domini. Qui, usiamo la trascrittomica per mappare importanti caratteristiche strutturali del dominio EWS intrinsecamente disordinato nel sarcoma di Ewing.
Molti tumori sono caratterizzati da traslocazioni cromosomiche che provocano l'espressione di fattori di trascrizione di fusione oncogenici. Tipicamente, queste proteine contengono un dominio intrinsecamente disordinato (IDD) fuso con il dominio di legame al DNA (DBD) di un'altra proteina e orchestrano cambiamenti trascrizionali diffusi per promuovere la malignità. Queste fusioni sono spesso l'unica aberrazione genomica ricorrente nei tumori che causano, rendendoli bersagli terapeutici attraenti. Tuttavia, il targeting dei fattori di trascrizione oncogenici richiede una migliore comprensione del ruolo meccanicistico che gli IDD a bassa complessità svolgono nella loro funzione. Il dominio N-terminale di EWSR1 è un IDD coinvolto in una varietà di fattori di trascrizione di fusione oncogenica, tra cui EWS / FLI, EWS / ATF e EWS / WT1. Qui, usiamo il sequenziamento dell'RNA per studiare le caratteristiche strutturali del dominio EWS importanti per la funzione trascrizionale di EWS / FLI nel sarcoma di Ewing. Viene eseguita la prima deplezione mediata da shRNA della fusione endogena da cellule di sarcoma di Ewing accoppiata con l'espressione ectopica di una varietà di costrutti mutanti EWS. Quindi il sequenziamento dell'RNA viene utilizzato per analizzare i trascrittomi delle cellule che esprimono questi costrutti per caratterizzare i deficit funzionali associati alle mutazioni nel dominio EWS. Integrando le analisi trascrittomiche con le informazioni precedentemente pubblicate sui motivi di legame del DNA EWS / FLI e la localizzazione genomica, nonché i saggi funzionali per la capacità di trasformazione, siamo stati in grado di identificare le caratteristiche strutturali di EWS / FLI importanti per l'oncogenesi e definire un nuovo set di geni bersaglio EWS / FLI critici per il sarcoma di Ewing. Questo articolo dimostra l'uso del sequenziamento dell'RNA come metodo per mappare la relazione struttura-funzione del dominio intrinsecamente disordinato dei fattori di trascrizione oncogenici.
Un sottogruppo di tumori, tra cui molte neoplasie maligne dell'infanzia e dell'adolescenza, sono caratterizzate da traslocazioni cromosomiche che generano nuovi oncogeni di fusione1,2,3,4,5,6. Le proteine di fusione risultanti funzionano frequentemente come fattori di trascrizione oncogenici, orchestrando cambiamenti diffusi nella regolazione trascrizionale per promuovere la tumorigenesi7,8. I tumori con queste traslocazioni possiedono comunemente un paesaggio mutazionale altrimenti tranquillo, con poche aberrazioni genomiche ricorrenti a parte la fusione patognomonica4,9. Pertanto, il targeting diretto della proteina di fusione è una strategia terapeutica interessante in queste malattie. Tuttavia, questi fattori di trascrizione oncogenici consistono comunemente in un dominio a bassa complessità, intrinsecamente disordinato, che attiva trascrizionalmente fuso con un dominio di legame al DNA (DBD)10,11, 12,13,14. Sia i domini intrinsecamente disordinati (IDD) che i DBD di queste proteine si sono dimostrati difficili da colpire con approcci farmacologici convenzionali. Lo sviluppo di nuovi approcci terapeutici, quindi, richiede una comprensione molecolare più dettagliata dei meccanismi impiegati da queste fusioni per regolare aberrantemente l'espressione genica.
La porzione IDD N-terminale di EWSR1 è comunemente fusa con una DBD nel cancro, tra cui EWS / FLI nel sarcoma di Ewing, EWS / WT1 nel tumore diffuso a piccole cellule rotonde e EWS / ATF1 nel sarcoma a cellule chiare delle parti molli10. Il ruolo meccanicistico dell'IDD EWS in ciascuna di queste fusioni non è completamente compreso. La famiglia di fusioni EWS/ETS, in particolare EWS/FLI, è la più funzionalmente caratterizzata fino ad oggi. EWS/FLI coordina i cambiamenti epigenetici e trascrizionali a livello di genoma che portano all'attivazione e alla repressione di migliaia di geni7,11,15,16. Gli studi hanno dimostrato che l'IDD è importante per il reclutamento sia di co-attivatori trascrizionali (come p300, WDR5 e il complesso BAF), sia di co-repressori (come il complesso NuRD)11,15,17. La fusione dell'IDD EWS con la porzione C-terminale di FLI1 conferisce una nuova specificità di legame del DNA alla DBD ETS di FLI1, tale che l'oncoproteina di fusione (EWS/FLI) si lega a regioni ripetitive del genoma GGAA-microsatellite oltre al motivo ETS di consenso18,19,20. In combinazione con la funzione di reclutamento del co-attivatore, questa attività emergente di legame al DNA di EWS / FLI promuove la formazione di potenziatori de novo nei siti di inizio della trascrizione distale a GGAA -microsatelliti distali (TSS) (microsatelliti "enhancer-like") e recluta RNA polimerasi II per promuovere la trascrizione a GGAA-microsatelliti prossimali a TSS (microsatelliti "promoter-like")11,15,16,21.
Presi insieme, questi dati ci hanno portato a ipotizzare che elementi discreti all'interno del dominio EWS contribuiscano al reclutamento di co-regolatori distinti in diversi tipi di siti di legame EWS / FLI. Tuttavia, discernere questi elementi all'interno della porzione EWS di EWS / FLI e come funzionano, è stato ostacolato dalla natura altamente ripetitiva e disordinata del dominio. Qui utilizziamo un sistema di knockdown-rescue precedentemente pubblicato nelle cellule del sarcoma di Ewing per mappare funzionalmente questi elementi nell'IDD EWS. In questo sistema EWS/FLI viene impoverito utilizzando uno shRNA mirato al 3'UTR del gene FLI1, e l'espressione viene salvata con vari costrutti cDNA mutanti EWS/FLI privi del 3'UTR7,17,22. Questi esperimenti si sono concentrati su costrutti con varie delezioni per mappare la relazione struttura-funzione tra l'IDD EWS e importanti fenotipi oncogeni, tra cui l'attivazione di un costrutto reporter GGAA-microsatellite, saggi di formazione di colonie e convalida mirata di geni attivati e repressi da EWS / FLI7,17,22 . Tuttavia, questi studi non sono riusciti a trovare sottodomini discreti all'interno dell'IDD EWS in EWS / FLI che sono di importanza univoca per l'attivazione o la repressione. Tutti i costrutti testati erano in grado di attivare e reprimere specifici geni bersaglio, portando a un'efficiente formazione di colonie, o incapaci di regolare nessuno dei geni bersaglio EWS / FLI, portando alla perdita della formazione della colonia7,17,22.
Le analisi trascrittomiche rese possibili dall'adozione diffusa del sequenziamento di nuova generazione sono comunemente utilizzate per confrontare le firme di espressione genica in due condizioni, spesso nel contesto di screening o studi descrittivi. Volevamo invece sfruttare la capacità di acquisire dati di espressione a livello di genoma utilizzando il sequenziamento dell'RNA (RNA-seq) per caratterizzare i contributi degli IDD alla funzione del fattore di trascrizione. In questo caso RNA-seq è accoppiato con il sistema knockdown-rescue per esplorare la relazione struttura-funzione del dominio EWS. Questo approccio è applicabile ad altri fattori di trascrizione di fusione, comprese altre fusioni EWS o fattori di trascrizione wildtype con funzione poco compresa, e presenta molteplici vantaggi rispetto agli altri saggi utilizzati per studi di mappatura funzionale, come saggi reporter o qRT-PCR mirata. Questi includono il test dei determinanti strutturali della funzione nel contesto della cromatina pertinente, la capacità di testare più tipi di elementi di risposta in un unico test (cioè attivato e represso, GGAA-microsatellite e non microsatellite, ecc.) e la conseguente capacità di rilevare meglio la funzione parziale.
Il successo dell'implementazione di questo approccio dipende da un sistema basato su cellule che cattura i fenotipi di interesse (in questo caso cellule A673 con deplezione EWS/FLI mediata da shRNA) e da un pannello di costrutti mutanti in un vettore di espressione appropriato per il sistema basato su cellule (in questo caso, pMSCV-hygro con vari mutanti EWS/FLI 3x-FLAG-tagged da erogare per trasduzione retrovirale). La trasduzione virale di costrutti di deplezione basati su CRISPR, costrutti di deplezione basati su shRNA e costrutti di espressione del cDNA con una selezione appropriata per generare linee cellulari stabili è raccomandata rispetto alla trasfezione transitoria. L'interpretazione a valle dei risultati è rafforzata quando i dati trascrittomici possono essere abbinati ad altri dati relativi alla localizzazione del fattore di trascrizione e ad altre letture fenotipiche ove disponibili.
In questo articolo, applichiamo questo approccio per caratterizzare l'attività del mutante DAF di EWS / FLI14. Il mutante DAF ha 17 mutazioni da tirosina ad alanina nelle regioni ripetitive dell'EWS IDD di EWS/FLI14. Questo particolare mutante EWS era stato precedentemente riportato e non è in grado di attivare l'espressione genica reporter quando fuso con l'ATF1 DBD14. Tuttavia, i dati preliminari della qRT-PCR hanno suggerito che questo mutante è stato in grado di attivare la trascrizione del bersaglio EWS/FLI NR0B123. L'approccio trascrittomico qui descritto ha permesso di rilevare con successo la funzione parziale del mutante DAF. Accoppiando questi dati trascrittomici con informazioni sui motivi di legame e riconoscimento EWS/FLI dimostriamo inoltre che il mutante DAF mantiene la funzione alle ripetizioni GGAA-microsatellite. Questi risultati identificano DAF come il primo mutante EWS/FLI parzialmente funzionale ed evidenziano la funzione nei geni non microsatelliti come importante per l'oncogenesi (come riportato23). Ciò dimostra la potenza di questo approccio di mappatura struttura-funzione trascrittomica per fornire informazioni sulla funzione dei fattori di trascrizione oncogenici.
1. Impostare un pannello di costrutti in vitro
NOTA: Questo passaggio varierà a seconda della proteina specifica da analizzare.
2. Raccogliere cellule, convalidare l'espressione di costrutti e impostare saggi fenotipici correlativi
3. Sequenziamento di nuova generazione
4. Pipeline di allineamento e conteggio delle trascrizioni
Nota : questo protocollo presuppone che dopo l'invio e l'elaborazione di esempio, viene restituito un set di file FASTQ accoppiati per ogni campione. Questi file sono spesso compressi con un suffisso di "fastq.gz". Un'ulteriore analisi di questi file FASTQ richiederà l'accesso a una struttura di calcolo ad alte prestazioni (HPC) che esegue un sistema operativo Linux.
5. Espressione differenziale e analisi a valle
6. Confronto con fenotipi rilevanti
I dati preliminari di qRT-PCR hanno suggerito che un mutante EWS/FLI chiamato DAF, con specifiche mutazioni da tirosina ad alanina nella regione ripetitiva e disordinata di EWS, ha mantenuto la capacità di attivare i geni bersaglio EWS/FLI, ma non è riuscito a reprimere i geni bersaglio critici23. Al fine di comprendere meglio la relazione tra questi residui nel dominio EWS e la funzione EWS/FLI, è stato utilizzato il protocollo sopra descritto e delineato nella Figura 1. Le cellule del sarcoma di Ewing A673 sono state trasdotte viralmente con uno shRNA mirato al 3'UTR di FLI1,con conseguente esaurimento di EWS/FLI endogeni. Dopo quattro giorni di selezione, la funzione EWS/FLI è stata salvata con la trasduzione virale di diversi costrutti mutanti EWS/FLI marcati 3XFLAG, con vettore vuoto come controllo per nessun salvataggio. Un mutante non funzionale privo del dominio EWS, chiamato Δ22, è stato usato come controllo negativo e EWS/FLI wild-type, chiamato wtEF, è stato usato come controllo positivo (Figura 2A). DAF è stato utilizzato come costrutto di test, anche se è possibile utilizzare più di un costrutto di test, se lo si desidera. Le cellule sono state selezionate per altri 10 giorni per consentire l'espressione del costrutto per stabilizzarsi e quindi raccolte per l'RNA (con una fase di rimozione del gDNA), proteine e saggi di formazione di colonie. Sono state raccolte quattro repliche e qRT-PCR rappresentativi e western blot che mostrano un efficace abbattimento e salvataggio sono mostrati nella Figura 2B-D. Va notato che le cellule salvate da DAF non sono riuscite a formare colonie come mostrato nella Figura 2E,suggerendo una ridotta trasformazione oncogenica.
Dopo il completamento della convalida della replica e dei saggi fenotipici, l'RNA è stato presentato all'Istituto di Medicina Genomica presso il Nationwide Children's Hospital per la preparazione della biblioteca e il sequenziamento di prossima generazione con ~ 50 milioni di letture accoppiate da 150 bp raccolte. I dati sono stati restituiti come file fastq.gz. Le letture di bassa qualità sono state tagliate da questi file con TrimGalore e STAR è stato utilizzato per allineare le letture al genoma umano hg19 e contare le letture per gene. hg19 è stato utilizzato ai fini della compatibilità con gli altri set di dati curati per EWS / FLI utilizzati nell'analisi a valle. Questi conteggi di lettura sono stati combinati in un'unica matrice di conteggio per tutti i campioni, le prime 6 righe delle quali sono mostrate nella Figura 3.
I conteggi sono stati inizialmente eseguiti attraverso DESeq2 senza normalizzazione del lotto, tuttavia, l'ispezione visiva della distanza da campione a campione ha mostrato potenziali effetti di confusione del lotto come mostrato evidenziato con frecce rosse nella Figura 4A. Ciò probabilmente è sorto a causa della variabilità biologica introdotta dal passaggio delle cellule in coltura e delle differenze nella lavorazione di ciascun lotto. La normalizzazione per gli effetti batch è stata eseguita con ComBat ed è generalmente raccomandata. Le distanze da campione a campione dei dati normalizzati dal lotto sono mostrate nella Figura 4B. Dopo la normalizzazione del batch, DESeq2 è stato utilizzato per generare profili trascrizionali per i tre costrutti (wtEF, Δ22 e DAF) relativi alla linea di base. Si noti che mentre le cellule A673 "parentali" (mock knockdown e mock rescue, chiamate "iLuc" qui) sono state incluse nell'analisi differenziale, il riferimento per questo esperimento sono le cellule con EWS / FLI-depleted, chiamate cellule iEF. Il profilo trascrizionale può essere generato per la proteina endogena qui confrontando il campione iLuc con iEF, e questo può essere utile per capire come funziona il sistema di salvataggio, ma questo non è l'obiettivo di questa particolare analisi. I profili trascrizionali generati per i mutanti includono controlli positivi (wtEF) e negativi (Δ22), rispetto all'iEF, in modo tale che questi dovrebbero funzionare come parametri di riferimento per altri mutanti. Questo è importante, poiché il controllo positivo in questo esempio non ha completamente ricapitolato la funzione di EWS/FLI endogena come discusso altrove7,23.
L'analisi dei componenti principali (PCA) nella Figura 5 suggerisce che il profilo trascrizionale del DAF è intermedio tra wtEF e Δ22, confermando la funzione parziale. Inoltre, il raggruppamento gerarchico dei 1000 geni più variabili tra i campioni ha mostrato che DAF non è riuscito a reprimere i geni bersaglio EWS / FLI e ha mantenuto solo parzialmente l'attività di attivazione genica come mostrato in Figura 6A e Figura S5. L'analisi di ToppGene ha suggerito che le classi di geni attivate da DAF sono funzionalmente distinte da quei bersagli attivati da EWS/FLI in cui DAF non è funzionale (Figura 6B). È interessante notare che la funzione dei geni attivati salvati da wtEF, ma non da DAF, sembra essere correlata al controllo trascrizionale e alla regolazione della cromatina. Sulla base dei risultati dei test di formazione delle colonie, i geni di questa firma genica di base dovrebbero essere ulteriormente analizzati per il loro ruolo nell'oncogenesi mediata da EWS / FLI. L'importanza della repressione genica mediata da EWS/FLI è stata precedentemente descritta17.
È noto che EWS/FLI possiede un'affinità di legame unica per gli elementi di ripetizione GGAA-microsatellite19,22,e che il legame a questi elementi guida la regolazione genica a valle11,15,18,20,22. Questi microsatelliti sono stati caratterizzati come associati all'attivazione o alla repressione e prossimali a (< 5 kb) TSS o distali a (> 5 kb) TSS25. Inoltre, ci sono geni regolati da EWS / FLI con motivi ETS ad alta affinità (HA) prossimali a TSS23. Al fine di analizzare ulteriormente le caratteristiche della funzione DAF e quali tipi di geni attivati da EWS / FLI DAF è stato in grado di salvare, è stata analizzata l'espressione differenziale dei geni associati a queste diverse classi. È interessante notare che DAF è stato più in grado di salvare i geni attivati dai microsatelliti GGAA, ma non è stato in grado di salvare i geni attivati vicino a un sito HA come visto nella Figura 7. Come si è visto con il clustering gerarchico, DAF non riesce a salvare la repressione mediata da EWS / FLI tra le classi di motivi. Questi dati suggeriscono che DAF mantiene caratteristiche strutturali sufficienti di EWS per legarsi e attivarsi dai microsatelliti GGAA, sia prossimali che distali a TSS. Questo probabilmente deriva dal dominio SYGQ intatto ritenuto importante per l'attività EWS / FLI alle ripetizioni GGAA11. Questi dati suggeriscono anche che le tirosine specifiche mutate in DAF svolgono ruoli importanti, ma poco compresi, nella regolazione genica mediata da EWS / FLI dai siti HA, nonché nella repressione genica, evidenziando un'importante area di ulteriori indagini.
Figura 1: Flusso di lavoro. Rappresentazione della procedura passo-passo per eseguire la mappatura struttura-funzione mediante trascrittomica. Le celle sono state preparate per la prima volta per esprimere la suite di costrutti necessari per la mappatura struttura-funzione. Dopo l'espressione, le cellule sono state raccolte per RNA e proteine e analizzate per fenotipi correlativi. L'espressione dei costrutti è stata convalidata e questo processo è stato ripetuto 3-4 volte per raccogliere repliche biologiche indipendenti. L'RNA è stato quindi sottoposto al sequenziamento di nuova generazione (NGS). Quando i dati sono stati ricevuti, i dati sono stati tagliati per la qualità, allineati e sono stati calcolati i conteggi per trascrizione. Gli effetti batch sono stati controllati e le firme trascrittomiche e l'espressione differenziale sono state determinate utilizzando DESeq2. È possibile incorporare il clustering gerarchico e l'analisi a valle che integrano altri set di dati -omics e diversi percorsi o analisi funzionali. Fare clic qui per visualizzare una versione più grande di questa figura.
Figura 2: Validazione dell'espressione del costrutto e dei saggi correlativi. (A) Schema raffigurante i costrutti testati in questo esempio. (B) Validazione del knockdown di EWS/FLI endogeno ed espressione di costrutti marcati 3X-FLAG mediante immunoblot. (C,D) Validazione dell'attività di costruzione in un gene bersaglio attivato EWS/FLI(C), NR0B1,e(D)gene bersaglio represso, TGFBR2,mediante qRT-PCR. I dati sono presentati come deviazione media +/- standard. I valori P sono stati calcolati con un test di significato onesto di Tukey. * p < 0,05, ** p < 0,01, *** p < 0,005 (E) Conteggi delle colonie da saggi soft-agar eseguiti per valutare l'attività di trasformazione dei costrutti. I valori P sono stati calcolati con un test di significato onesto di Tukey. * p < 0,05, ** p < 0,01, *** p < 0,005. Questa figura è adattata da Theisen, et al.23Fare clic qui per visualizzare una versione più grande di questa figura.
Figura 3: Dati finali di conteggio raccolti per l'analisi. Screenshot delle prime 6 righe del file di conteggio con conteggi genetici per tutti i campioni da normalizzare e analizzare in batch. Fare clic qui per visualizzare una versione più grande di questa figura.
Figura 4: Mappe di calore della distanza da campione a campione. (A) Grafico della distanza da campione a campione che mostra il raggruppamento del campione dei dati grezzi del conteggio. I campioni che vengono raggruppati sia per batch che per campione sono indicati con frecce rosse. (B) Diagramma di distanza da campione a campione dopo la normalizzazione del lotto con ComBat. Qui, i campioni di tutte le repliche si raggruppano insieme, indipendentemente dal batch. Fare clic qui per visualizzare una versione più grande di questa figura.
Figura 5: Risultati dell'analisi delle espressioni differenziali. (A) Il grafico dell'analisi delle componenti principali (PCA) delle firme trascrittomiche generate per tutti i campioni mostra un forte raggruppamento intracampionario e dimostra che il DAF è intermediato tra i controlli positivo (wtEF) e negativo (Δ22). (B) Grafici vulcanici che mostrano il -log(p-value) tracciato contro il log2FoldChange per i geni in ogni costrutto. Geni con un valore p aggiustato < 0,05 e un |log2(FoldChange)| > 1 sono considerati significativi e sono mostrati in rosso. Il pannello 5B è adattato da Theisen, et al.23Fare clic qui per visualizzare una versione più grande di questa figura.
Figura 6: Clustering gerarchico per identificare le classi geniche. (A) Il clustering gerarchico dei primi 1000 geni più variabili in tutti i costrutti e la linea di base, iEF, mostra che DAF salva parzialmente l'attivazione genica mediata da EWS / FLI. (B)L'ontologia genica (funzione molecolare) è il risultato di ToppGene che mostra l'arricchimento funzionale dei geni attivati da EWS/FLI che vengono salvati o non salvati dal DAF. Il pannello 6B è adattato da Theisen, et al.23Fare clic qui per visualizzare una versione più grande di questa figura.
Figura 7: Analisi dettagliata di diversi elementi di risposta del fattore di trascrizione a diversi costrutti: (A) Schematico raffigurante l'elaborazione dei dati utilizzata per generare pannelli (B) e (C) incorporando altri set di dati disponibili con i profili trascrittomici qui. (B,C) Compilazione che mostra il salvataggio di diverse classi di bersagli diretti EWS/FLI- (B) attivati e (C) repressi. I geni inclusi erano solo quei geni con espressione differenziale rilevabile da EWS/FLI endogena. In ogni grafico a torta, il grigio raffigura la porzione di geni che non vengono salvati dal costrutto. Il rosso raffigura la porzione di geni che sono attivati in modo differenziale e il blu raffigura la porzione di geni che sono differenzialmente repressi. Questa figura è adattata da Theisen, et al.23Fare clic qui per visualizzare una versione più grande di questa figura.
Figura S1: Caricamento dei file fastq.gz nell'ambiente HPC, ritaglio e allineamento. Fare clic qui per scaricare questa figura.
Figura S2: Confronto dei conteggi di lettura tra i campioni ed esecuzione della normalizzazione batch con ComBat. Fare clic qui per scaricare questa figura.
Figura S3: Esecuzione di DESeq2 ed estrazione dei risultati dell'analisi delle espressioni differenziali. Fare clic qui per scaricare questa figura.
Figura S4: Analisi dell'output. Fare clic qui per scaricare questa figura.
Figura S5: Clustering gerarchico per identificare le classi geniche: Raggruppamento gerarchico dei primi 1000 geni più variabili in tutti i costrutti e la linea di base, iEF, ordinati in k cluster. In questo caso k=7, ma questo parametro viene impostato dall'utente come mostrato nella Figura S4D. Fare clic qui per scaricare questa figura.
Tabella S1: Elenco dei geni (ID gene Ensembl) con annotazione a cluster. Fare clic qui per scaricare questa tabella.
Studiare i meccanismi biochimici dei fattori di trascrizione oncogenici è di fondamentale importanza per comprendere le malattie che causano e per progettare nuove strategie terapeutiche. Ciò è particolarmente vero nelle neoplasie maligne caratterizzate da traslocazioni cromosomiche con conseguente fattori di trascrizione della fusione. I domini inclusi in queste proteine chimeriche possono mancare di interazioni significative con i domini regolatori presenti nelle proteine wild-type, complicando la capacità di interpretare le informazioni struttura-funzione nel contesto della fusione26,27,28. Inoltre, molte di queste fusioni oncogeniche sono caratterizzate da domini intrinsecamente disordinati a bassa complessità10,13,29,30.
Il dominio EWS è un esempio di un dominio intrinsecamente disordinato che è coinvolto in una varietà di fusioni oncogeniche10. La natura intrinsecamente disordinata e ripetitiva ha ostacolato gli sforzi per comprendere i meccanismi molecolari impiegati dal dominio EWS. Gli sforzi precedenti per studiare la struttura-funzione hanno in gran parte fatto ricorso all'uso di diversi mutanti nel contesto di saggi genici reporter o in background cellulari che non riescono a ricapitolare il contesto cellulare pertinente, o mancano di variazioni strutturali che producono una funzione parziale significativa11,17,25. Il metodo qui presentato affronta questi problemi. La mappatura struttura-funzione viene eseguita in un contesto cellulare rilevante per la malattia e il sequenziamento di nuova generazione consente la profilazione trascrittomica per valutare la funzione del fattore di trascrizione nel setting della cromatina nativa. Nel caso specifico del mutante DAF di EWS/FLI, DAF è stato segnalato per mostrare poca attività nei saggi reporter utilizzando elementi di risposta isolati, ma per mostrare attività nel contesto del promotore genetico completo, sia in un test reporter che in cromatina nativa, suggerendo un fenotipointeressante 23. L'uso del metodo qui descritto risolve più direttamente la questione di quale tipo di elementi regolatori attraverso il genoma sono più reattivi nel contesto della malattia. Testando contemporaneamente tutti i geni bersaglio candidati nel loro contesto nativo di cromatina, un approccio trascrittomico ha maggiori probabilità di identificare costrutti con funzione parziale.
La forza intrinseca dell'utilizzo di uno sfondo cellulare rilevante per la malattia è forse il più grande limite di questa tecnica. Uno dei fattori più importanti è la scelta del sistema cellulare appropriato per questi esperimenti. Molte linee cellulari derivate da tumori maligni con fattori di trascrizione patognomonici non tollerano prontamente l'abbattimento di quel fattore di trascrizione, e in molti casi, in particolare per i tumori pediatrici, la vera cellula di origine rimane controversa e l'espressione dell'oncogene in altri background cellulari è proibitivamente tossica31,32 . In questi casi, può essere utile eseguire esperimenti in un diverso background cellulare, purché il ricercatore eserciti cautela nell'interpretazione dei risultati e convalidi in modo appropriato qualsiasi risultato rilevante in un tipo di cellula più rilevante per la malattia.
È di fondamentale importanza convalidare attentamente la stabilità e le conseguenze fenotipiche dell'espressione dell'oncogene e presentare solo campioni per il sequenziamento che soddisfano criteri rigorosi. Qui, questo includeva western blot per confermare l'abbattimento e il salvataggio e qRT-PCR di un piccolo numero di geni bersaglio noti per convalidare il controllo positivo (Figura 2). Allo stesso modo è fondamentale ridurre la massima variabilità possibile dei lotti eseguendo attentamente i preparati cellulari e di RNA nel modo più simile possibile attraverso ciascun lotto.
Il metodo qui descritto diventa particolarmente potente se abbinato ad altri tipi di dati genomici che parlano della funzione genome-wide del fattore di trascrizione in studio. Le direzioni future per questo tipo di analisi struttura-funzione si espanderebbero per includere ChIP-seq e ATAC-seq per determinare il legame del fattore di trascrizione e qualsiasi cambiamento indotto nell'accessibilità della cromatina. Come suite, questo tipo di dati può indicare dove diversi componenti strutturali di un fattore di trascrizione oncogenico contribuiscono a diversi aspetti della funzione (cioè legame al DNA vs modifica della cromatina vs reclutamento co-regolatore). Nel complesso, l'utilizzo di approcci basati su NGS per mappare le relazioni struttura-funzione dei fattori di trascrizione della fusione può rivelare nuove intuizioni nei determinanti biochimici della funzione oncogenica di queste proteine. Questo è importante per approfondire la nostra comprensione delle malattie che causano e per consentire lo sviluppo di nuove strategie terapeutiche.
SLL dichiara un conflitto di interessi in qualità di membro del comitato consultivo e azionista di Salarius Pharmaceuticals. SLL è anche un inventore elencato su United States Patents No. US 7.393.253 B2, "Metodi e composizioni per la diagnosi e il trattamento del sarcoma di Ewing", e US 8.557.532, "Diagnosi e trattamento del sarcoma di Ewing resistente ai farmaci". Ciò non altera la nostra aderenza alle politiche di JoVE sulla condivisione di dati e materiali.
Questa ricerca è stata supportata dalla High Performance Computing Facility presso l'Abigail Wexner Research Institute del Nationwide Children's Hospital. Questo lavoro è stato supportato dal National Institutes of Health National Cancer Institute [U54 CA231641 a SLL, R01 CA183776 a SLL]; Alex's Lemonade Stand Foundation [Young Investigator Award a ERT]; Pelotonia [Fellowship to ERT]; e il National Health and Medical Research Council CJ Martin Overseas Biomedical Fellowship [APP1111032 a KIP].
Name | Company | Catalog Number | Comments |
Wet Lab Reagents | |||
anti-FLI rabbit pAb | Abcam | ab15289 | 1:500 |
anti-lamin B1 rabbit pAb | Abcam | ab16048 | 1:2000 |
Cell-based system for introduction of mutant constructs | Determined by cell system used | ||
Cryotubes | For viral aliquots | ||
DMEM | Corning Cellgro | 10-013-CV | For viral production |
Fetal bovine serum | Gibco | 16000-044 | For viral production |
G418 | ThermoFisher | 10131027 | For viral production |
HEK293-EBNAs | ATCC | CRL-10852 | For viral production |
HEPES | Gibco | 15630106 | |
Hygromycin B | ThermoFisher | 10687010 | |
M2 anti-FLAG mouse mAb | Sigma | F3165 | 1:2000 |
Near IR-secondary antibodies | Li-Cor | ||
Optimem | Gibco | 31985062 | For viral production |
Penicillin/Streptomycin/Glutamine | Gibco | 10378-016 | For viral production |
Polybrene | Sigma | TR-1003-G | For viral transduction |
Puromycin | Sigma | P8833 | Stored at 2 mg/mL stock |
RNeasy Plus kit | Qiagen | 74136 | Has gDNA removal columns |
Selection reagents | As dictated by cell system used | ||
Sodium Pyruvate | Gibco | 11360-070 | For viral production |
Tissue culture media | Determined by cell system used | ||
TransIT-LT1 | Mirus | MIR 2304 | For viral production |
Software | |||
Access to HPC environment | |||
AnnotationDbi | 1.38.2 | ||
Cairo | 1.5-10 | ||
DESeq2 | 1.16.1 | ||
genefilter | 1.58.1 | ||
ggbiplot | 0.55 | ||
ggplot2 | 3.1.1 | ||
org.Hs.eg.db | 3.4.1 | ||
pheatmap | 1.0.12 | ||
PuTTY | |||
R | 3.4.0 | ||
RColorBrewer | 1.1-2 | ||
reshape2 | 1.4.3 | ||
rgl | 0.100.19 | ||
R-studio | |||
STAR | Version 2.6 or later | ||
sva | 3.24.4 | ||
TrimGalore! | |||
WinSCP |
Richiedi autorizzazione per utilizzare il testo o le figure di questo articolo JoVE
Richiedi AutorizzazioneThis article has been published
Video Coming Soon