Method Article
Intrinsisch ungeordnete Domänen sind wichtig für die Funktion des onkogenen Fusionstranskriptionsfaktors. Um diese Proteine therapeutisch anzugreifen, ist ein detaillierteres Verständnis der Regulationsmechanismen dieser Domänen erforderlich. Hier verwenden wir Transkriptomik, um wichtige strukturelle Merkmale der intrinsisch gestörten EWS-Domäne im Ewing-Sarkom abzubilden.
Viele Krebsarten sind durch chromosomale Translokationen gekennzeichnet, die zur Expression onkogener Fusionstranskriptionsfaktoren führen. Typischerweise enthalten diese Proteine eine intrinsisch ungeordnete Domäne (IDD), die mit der DNA-Bindungsdomäne (DBD) eines anderen Proteins verschmolzen ist, und orchestrieren weit verbreitete transkriptionelle Veränderungen, um Malignität zu fördern. Diese Fusionen sind oft die einzige wiederkehrende genomische Aberration bei den von ihnen verursachten Krebsarten, was sie zu attraktiven therapeutischen Zielen macht. Das Targeting onkogener Transkriptionsfaktoren erfordert jedoch ein besseres Verständnis der mechanistischen Rolle, die IDDs mit geringer Komplexität in ihrer Funktion spielen. Die N-terminale Domäne von EWSR1 ist eine IDD, die an einer Vielzahl von onkogenen Fusionstranskriptionsfaktoren beteiligt ist, einschließlich EWS/FLI, EWS/ATF und EWS/WT1. Hier untersuchen wir mit hilfe der RNA-Sequenzierung die strukturellen Merkmale der EWS-Domäne, die für die Transkriptionsfunktion von EWS/FLI beim Ewing-Sarkom wichtig sind. Die erste shRNA-vermittelte Depletion der endogenen Fusion aus Ewing-Sarkomzellen gepaart mit ektopischer Expression einer Vielzahl von EWS-mutanten Konstrukten wird durchgeführt. Dann wird RNA-Sequenzierung verwendet, um die Transkriptome von Zellen zu analysieren, die diese Konstrukte exprimieren, um die funktionellen Defizite zu charakterisieren, die mit Mutationen in der EWS-Domäne verbunden sind. Durch die Integration der transkriptomischen Analysen mit zuvor veröffentlichten Informationen über EWS/FLI-DNA-Bindungsmotive und genomische Lokalisierung sowie funktionelle Assays zur Transformationsfähigkeit konnten wir strukturelle Merkmale von EWS/FLI identifizieren, die für die Onkogenese wichtig sind, und einen neuartigen Satz von EWS/FLI-Zielgenen definieren, die für das Ewing-Sarkom entscheidend sind. Diese Arbeit demonstriert die Verwendung der RNA-Sequenzierung als Methode, um die Struktur-Funktions-Beziehung der intrinsisch gestörten Domäne onkogener Transkriptionsfaktoren abzubilden.
Eine Untergruppe von Krebsarten, einschließlich vieler Malignome der Kindheit und Jugend, sind durch chromosomale Translokationen gekennzeichnet, die neuartige Fusionsonkogene1,2,3,4,5,6erzeugen. Die resultierenden Fusionsproteine fungieren häufig als onkogene Transkriptionsfaktoren und orchestrieren weit verbreitete Veränderungen in der Transkriptionsregulation, um die Tumorgenese zu fördern7,8. Krebsarten mit diesen Translokationen besitzen gewöhnlich eine ansonsten ruhige Mutationslandschaft mit wenigen wiederkehrenden genomischen Aberrationen, abgesehen von der pathognomonischen Fusion4,9. Daher ist das direkte Targeting des Fusionsproteins eine attraktive therapeutische Strategie bei diesen Erkrankungen. Diese onkogenen Transkriptionsfaktoren bestehen jedoch üblicherweise aus einer wenig komplexen, intrinsisch ungeordneten, transkriptionsaktivierenden Domäne, die mit einer DNA-bindenden Domäne (DBD)10,11,12,13,14verschmolzen ist. Sowohl die intrinsisch ungeordneten Domänen (IDDs) als auch die DBDs dieser Proteine haben sich mit herkömmlichen pharmakologischen Ansätzen als schwierig erwiesen. Die Entwicklung neuartiger therapeutischer Ansätze erfordert daher ein detaillierteres molekulares Verständnis der Mechanismen, die von diesen Fusionen verwendet werden, um die Genexpression abnormal zu regulieren.
Der N-terminale IDD-Anteil von EWSR1 wird üblicherweise mit einer DBD bei Krebs verschmolzen, einschließlich EWS / FLI bei Ewing-Sarkom, EWS / WT1 bei diffusem kleinzelligem Rundzelltumor und EWS / ATF1 bei klarzelligen Sarkomen von Weichteilen10. Die mechanistische Rolle der EWS IDD in jeder dieser Fusionen ist unvollständig verstanden. Die EWS/ETS-Fusionsfamilie, insbesondere EWS/FLI, ist die bisher funktionell am besten charakterisierte. EWS/FLI koordiniert genomweite epigenetische und transkriptionelle Veränderungen, die zur Aktivierung und Unterdrückung von Tausenden von Genen führen7,11,15,16. Studien haben gezeigt, dass die IDD sowohl für die Rekrutierung von transkriptionellen Co-Aktivatoren (wie p300, WDR5 und dem BAF-Komplex) als auch von Co-Repressoren (wie dem NuRD-Komplex)11,15,17wichtig ist. Die Fusion der EWS-IDD mit dem C-terminalen Teil von FLI1 verleiht der ETS-DBD von FLI1 eine neuartige DNA-Bindungsspezifität, so dass das Fusions-Onkoprotein (EWS/FLI) zusätzlich zum Konsensus-ETS-Motiv18,19,20an sich wiederholende GGAA-Mikrosatellitenregionen des Genoms bindet. In Kombination mit der Co-Activator-Rekrutierungsfunktion fördert diese emergente DNA-Bindungsaktivität von EWS/FLI die De-novo-Enhancer-Bildung an GGAA-Mikrosatelliten, die distal zu Transkriptionsstartstellen (TSS) ("Enhancer-ähnliche" Mikrosatelliten) sind, und rekrutiert RNA-Polymerase II, um die Transkription an GGAA-Mikrosatelliten in der Nähe von TSS ("Promotor-ähnliche" Mikrosatelliten) zu fördern11,15,16,21.
Zusammengenommen führten uns diese Daten zu der Hypothese, dass diskrete Elemente innerhalb des EWS-Bereichs zur Rekrutierung verschiedener Co-Regulatoren für verschiedene Arten von EWS/FLI-Bindungsstellen beitragen. Die Unterscheidung dieser Elemente innerhalb des EWS-Teils von EWS/FLI und ihre Funktionsweise wurde jedoch durch die stark repetitive und ungeordnete Natur der Domäne behindert. Hier verwenden wir ein zuvor veröffentlichtes Knockdown-Rescue-System in Ewing-Sarkomzellen, um diese Elemente in der EWS-IDD funktionell abzubilden. In diesem System wird EWS/FLI mit hilfe einer shRNA depletiert, die auf die 3'UTR des FLI1-Gens abzielt, und die Expression wird mit unterschiedlichen EWS/FLI-mutierten cDNA-Konstrukten gerettet, denen die 3'UTR7,17,22fehlen . Diese Experimente konzentrierten sich auf Konstrukte mit verschiedenen Deletionen, um die Struktur-Funktions-Beziehung zwischen der EWS-IDD und wichtigen onkogenen Phänotypen abzubilden, einschließlich der Aktivierung eines GGAA-Mikrosatelliten-Reporterkonstrukts, Koloniebildungsassays und der gezielten Validierung von EWS/FLI-aktivierten und -unterdrückten Genen7,17,22 . Diese Studien konnten jedoch keine diskreten Subdomänen innerhalb der EWS-IDD in EWS/FLI finden, die für die Aktivierung oder Repression einzigartig wichtig sind. Alle getesteten Konstrukte waren entweder in der Lage, spezifische Zielgene sowohl zu aktivieren als auch zu unterdrücken, was zu einer effizienten Koloniebildung führte, oder in der Lage, eines der EWS/FLI-Zielgene zu regulieren, was zum Verlust der Koloniebildung führte7,17,22.
Transkriptomische Analysen, die durch die weit verbreitete Einführung der Next-Generation-Sequenzierung ermöglicht werden, werden häufig verwendet, um Genexpressionssignaturen unter zwei Bedingungen zu vergleichen, häufig im Rahmen von Screening- oder deskriptiven Studien. Stattdessen wollten wir die Möglichkeit nutzen, genomweite Expressionsdaten mittels RNA-Sequenzierung (RNA-seq) zu erfassen, um die Beiträge von IDDs zur Transkriptionsfaktorfunktion zu charakterisieren. In diesem Fall wird RNA-seq mit dem Knockdown-Rescue-System gepaart, um die Struktur-Funktions-Beziehung der EWS-Domäne zu erforschen. Dieser Ansatz ist auf andere Fusionstranskriptionsfaktoren anwendbar, einschließlich anderer EWS-Fusionen oder Wildtyp-Transkriptionsfaktoren mit schlecht verstandener Funktion, und hat mehrere Vorteile gegenüber den anderen Assays, die für funktionelle Kartierungsstudien verwendet werden, wie Reporter-Assays oder gezielte qRT-PCR. Dazu gehören das Testen struktureller Funktionsdeterminanten im relevanten Chromatinkontext, die Fähigkeit, mehrere Arten von Antwortelementen in einem Assay zu testen (d.h. aktiviert und unterdrückt, GGAA-Mikrosatellit und Nicht-Mikrosatellit usw.) und die daraus resultierende Fähigkeit, Teilfunktionen besser zu erkennen.
Die erfolgreiche Implementierung dieses Ansatzes hängt von einem zellbasierten System ab, das die interessierenden Phänotypen (in diesem Fall A673-Zellen mit shRNA-vermittelter EWS/FLI-Depletion) und einem Panel von Mutantenkonstrukten in einem für das zellbasierte System geeigneten Expressionsvektor erfasst (in diesem Fall pMSCV-hygro mit verschiedenen 3x-FLAG-markierten EWS/FLI-Mutanten, die durch retrovirale Transduktion abgegeben werden sollen). Die virale Transduktion von CRISPR-basierten Depletionskonstrukten, shRNA-basierten Depletion-Konstrukten und cDNA-Expressionskonstrukten mit geeigneter Selektion zur Erzeugung stabiler Zelllinien wird gegenüber der transienten Transfektion empfohlen. Die nachgelagerte Interpretation der Ergebnisse wird verstärkt, wenn die transkriptomischen Daten mit anderen Daten im Zusammenhang mit der Lokalisierung des Transkriptionsfaktors und anderen phänotypischen Auslesungen, sofern verfügbar, gepaart werden können.
In diesem Artikel wenden wir diesen Ansatz an, um die Aktivität der DAF-Mutante von EWS/FLI14zu charakterisieren. Die DAF-Mutante hat 17 Tyrosin-zu-Alanin-Mutationen in den sich wiederholenden Regionen der EWS IDD von EWS/FLI14. Diese spezielle EWS-Mutante wurde zuvor berichtet und ist nicht in der Lage, die Reportergenexpression zu aktivieren, wenn sie mit dem ATF1 DBD14verschmolzen wird. Vorläufige qRT-PCR-Daten deuteten jedoch darauf hin, dass diese Mutante in der Lage war, die Transkription des EWS/FLI-Ziels NR0B123zu aktivieren. Der hier beschriebene transkriptomische Ansatz ermöglichte den erfolgreichen Nachweis der Teilfunktion der DAF-Mutante. Durch die Kombination dieser transkriptomischen Daten mit Informationen über EWS/FLI-Bindungs- und Erkennungsmotive zeigen wir weiter, dass die DAF-Mutante ihre Funktion bei GGAA-Mikrosatellitenwiederholungen beibehält. Diese Ergebnisse identifizieren DAF als die erste partiell funktionelle EWS/FLI-Mutante und heben die Funktion an Nicht-Mikrosatellitengenen als wichtig für die Onkogenese hervor (wieberichtet 23). Dies zeigt die Leistungsfähigkeit dieses transkriptomischen Struktur-Funktions-Mapping-Ansatzes, um Einblicke in die Funktion onkogener Transkriptionsfaktoren zu geben.
1. In-vitro-Konstrukt-Panel einrichten
HINWEIS: Dieser Schritt variiert je nach dem zu analysierenden Protein.
2. Sammeln Sie Zellen, validieren Sie die Expression von Konstrukten und richten Sie korrelative phänotypische Assays ein
3. Sequenzierung der nächsten Generation
4. Alignment und Transcript Counting Pipeline
HINWEIS: Bei diesem Protokoll wird davon ausgegangen, dass nach der Übermittlung und Verarbeitung des Beispiels für jedes Beispiel ein Satz gepaarter FASTQ-Dateien zurückgegeben wird. Diese Dateien werden häufig mit dem Suffix "fastq.gz" komprimiert. Die weitere Analyse dieser FASTQ-Dateien erfordert den Zugriff auf eine HPC-Einrichtung (High Performance Computing), auf der ein Linux-Betriebssystem ausgeführt wird.
5. Differentielle Expression und Downstream-Analyse
6. Vergleich mit relevanten Phänotypen
Vorläufige qRT-PCR-Daten deuteten darauf hin, dass eine EWS/FLI-Mutante namens DAF mit spezifischen Tyrosin-zu-Alanin-Mutationen in der sich wiederholenden und ungeordneten Region des EWS die Fähigkeit zur Aktivierung von EWS/FLI-Zielgenen aufrechterhielt, aber kritische Zielgene nicht unterdrückenkonnte 23. Um die Beziehung zwischen diesen Resten im EWS-Bereich und der EWS/FLI-Funktion besser zu verstehen, wurde das oben beschriebene und in Abbildung 1 dargestellte Protokoll verwendet. A673 Ewing-Sarkomzellen wurden viral mit einer shRNA transduziert, die auf die 3'UTR von FLI1abzielt, was zur Erschöpfung des endogenen EWS/FLI führte. Nach vier Tagen der Selektion wurde die EWS/FLI-Funktion mit viraler Transduktion verschiedener 3XFLAG-markierter EWS/FLI-Mutantenkonstrukte gerettet, mit leerem Vektor als Kontrolle für keine Rettung. Eine nicht-funktionelle Mutante, der die EWS-Domäne fehlt, genannt Δ22, wurde als Negativkontrolle verwendet und Wildtyp-EWS/FLI, genannt wtEF, wurde als Positivkontrolle verwendet (Abbildung 2A). DAF wurde als Testkonstrukt verwendet, obwohl bei Bedarf mehr als ein Testkonstrukt verwendet werden kann. Die Zellen wurden für weitere 10 Tage ausgewählt, um die Konstruktexpression zu stabilisieren, und dann für RNA (mit einem gDNA-Entfernungsschritt), Protein- und Koloniebildungsassays gesammelt. Vier Replikate wurden gesammelt und repräsentative qRT-PCR und Western Blots, die einen effektiven Knockdown und eine effektive Rettung zeigen,sind in Abbildung 2B-Ddargestellt. Es sollte beachtet werden, dass DAF-gerettete Zellen keine Kolonien bilden konnten, wie in Abbildung 2Egezeigt, was auf eine beeinträchtigte onkogene Transformation hindeutet.
Nach Abschluss der Replikationsvalidierung und der phänotypischen Assays wurde die RNA beim Institut für Genomische Medizin am Nationwide Children's Hospital zur Bibliotheksvorbereitung und Next-Generation-Sequenzierung mit ~ 50 Millionen 150-bp-Paired-End-Lesevorgängen eingereicht. Die Daten wurden als fastq.gz-Dateien zurückgegeben. Low-Quality-Reads wurden mit TrimGalore aus diesen Dateien abgeschnitten und STAR wurde verwendet, um Reads auf das menschliche Genom hg19 auszurichten und die Reads pro Gen zu zählen. hg19 wurde aus Gründen der Kompatibilität mit den anderen kuratierten Datensätzen für EWS/FLI verwendet, die in der downstreamn Analyse verwendet wurden. Diese Lesezählungen wurden zu einer einzigen Zählmatrix für alle Stichproben zusammengefasst, von denen die ersten 6 Zeilen in Abbildung 3 dargestelltsind.
Die Zählungen wurden zunächst ohne Batch-Normalisierung durch DESeq2 durchgeführt, jedoch zeigte die visuelle Inspektion des Proben-zu-Probe-Abstands potenzielle verwirrende Batch-Effekte, wie in Abbildung 4Amit roten Pfeilen hervorgehoben. Dies ist wahrscheinlich auf die biologische Variabilität zurückzuführen, die durch die Passage von Zellen in Kultur und Unterschiede in der Verarbeitung jeder Charge eingeführt wurde. Die Normalisierung für Batch-Effekte wurde mit ComBat durchgeführt und wird im Allgemeinen empfohlen. Die Sample-to-Sample-Abstände der batch-normalisierten Daten sind in Abbildung 4B dargestellt. Nach der Batch-Normalisierung wurde DESeq2 verwendet, um Transkriptionsprofile für die drei Konstrukte (wtEF, Δ22 und DAF) relativ zur Baseline zu generieren. Beachten Sie, dass, während "elterliche" A673-Zellen (Mock-Knockdown und Mock-Rettung, hier "iLuc" genannt) in die Differentialanalyse einbezogen wurden, die Referenz für dieses Experiment die Zellen mit EWS / FLI-depleted sind, die als iEF-Zellen bezeichnet werden. Das Transkriptionsprofil kann hier für das endogene Protein generiert werden, indem die iLuc-Probe mit iEF verglichen wird, und dies kann für das Verständnis der Funktionsweise des Rettungssystems von Interesse sein, aber das ist nicht das Ziel dieser speziellen Analyse. Die für die Mutanten generierten Transkriptionsprofile umfassen positive (wtEF) und negative (Δ22) Kontrollen in Bezug auf iEF, so dass diese als Benchmarks für andere Mutanten fungieren sollten. Dies ist wichtig, da die Positivkontrolle in diesem Beispiel die Funktion des endogenen EWS/FLI nicht vollständig rekapituliert hat, wie an anderer Stellediskutiert 7,23.
Die Hauptkomponentenanalyse (PCA) in Abbildung 5 legt nahe, dass das Transkriptionsprofil von DAF zwischen wtEF und Δ22 liegt, was die Teilfunktion bestätigt. Darüber hinaus zeigte die hierarchische Clusterung der 1000 unterschiedlichsten Gene über Proben hinweg, dass DAF die EWS/FLI-Zielgene nicht unterdrückte und die Genaktivierungsaktivität nur teilweise beibehielt, wie in Abbildung 6A und Abbildung S5gezeigt. Die ToppGene-Analyse deutete darauf hin, dass sich die Klassen von Genen, die DAF aktiviert, funktionell von jenen EWS/FLI-aktivierten Zielen unterscheiden, bei denen DAF nicht funktionsfähig ist (Abbildung 6B). Interessanterweise scheint die Funktion aktivierter Gene, die durch wtEF, aber nicht durch DAF gerettet wurden, mit der Transkriptionskontrolle und der Chromatinregulation zusammenzuhängen. Basierend auf den Ergebnissen der Koloniebildungsassays sollten die Gene aus dieser Kerngensignatur weiter auf ihre Rolle in der EWS/FLI-vermittelten Onkogenese analysiert werden. Die Bedeutung der EWS/FLI-vermittelten Genrepression wurde bereits beschrieben17.
Es ist bekannt, dass EWS/FLI eine einzigartige Bindungsaffinität für GGAA-Mikrosatelliten-Wiederholungselemente19,22besitzt und dass die Bindung an diesen Elementen die nachgeschaltete Genregulation11,15,18,20,22steuert. Diese Mikrosatelliten wurden entweder als mit Aktivierung oder Repression assoziiert und entweder proximal zu (< 5 kb) TSS oder distal zu (> 5 kb) TSS25charakterisiert. Darüber hinaus gibt es EWS/FLI-regulierte Gene mit hochaffinen (HA) ETS-Motiven in der Nähe von TSS23. Um die Eigenschaften der DAF-Funktion weiter zu analysieren und welche Arten von EWS/FLI-aktivierten Genen DAF retten konnte, wurde die differentielle Expression von Genen analysiert, die mit diesen verschiedenen Klassen assoziiert sind. Interessanterweise war DAF am ehesten in der Lage, GGAA-Mikrosatelliten-aktivierte Gene zu retten, aber nicht in der Lage, aktivierte Gene in der Nähe einer HA-Stelle zu retten, wie in Abbildung 7 zu sehen ist. Wie beim hierarchischen Clustering zu sehen ist, gelingt es DAF nicht, die EWS/FLI-vermittelte Repression über Motivklassen hinweg zu retten. Diese Daten deuten darauf hin, dass DAF genügend strukturelle Merkmale von EWS beibehält, um an GGAA-Mikrosatelliten zu binden und von ihnen zu aktivieren, sowohl proximal als auch distal zu TSS. Dies ergibt sich wahrscheinlich aus der intakten SYGQ-Domäne, die als wichtig für die EWS /FLI-Aktivität bei GGAA-Wiederholungen angesehen wird11. Diese Daten deuten auch darauf hin, dass die spezifischen Tyrosine, die in DAF mutiert sind, eine wichtige, aber wenig verstandene Rolle bei der EWS/FLI-vermittelten Genregulation von HA-Standorten sowie bei der Genrepression spielen, was einen wichtigen Bereich weiterer Untersuchungen hervorhebt.
Abbildung 1: Workflow. Darstellung des schrittweisen Vorgehens zur Durchführung eines Struktur-Funktions-Mappings durch Transkriptomics. Zellen wurden zuerst vorbereitet, um die Reihe von Konstrukten auszudrücken, die für die Struktur-Funktions-Abbildung erforderlich sind. Nach der Expression wurden Zellen für RNA und Protein geerntet und auf korrelative Phänotypen untersucht. Die Expression der Konstrukte wurde validiert, und dieser Prozess wurde 3-4 Mal wiederholt, um unabhängige biologische Replikate zu sammeln. RNA wurde dann für die Next-Generation-Sequenzierung (NGS) eingereicht. Wenn Daten empfangen wurden, wurden die Daten auf Qualität getrimmt, ausgerichtet und die Anzahl pro Transkript berechnet. Batch-Effekte wurden kontrolliert und transkriptomische Signaturen und differentielle Expression wurden mit DESeq2 bestimmt. Hierarchisches Clustering und Downstream-Analyse, die andere -omics-Datensätze und verschiedene Pathway- oder Funktionsanalysen integrieren, können integriert werden. Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.
Abbildung 2: Validierung von Konstruktexpression und korrelativen Assays. (A) Schematische Darstellung der in diesem Beispiel getesteten Konstrukte. (B) Validierung des Knockdowns von endogenem EWS/FLI und Expression von 3X-FLAG-markierten Konstrukten durch Immunoblot. (C,D) Validierung der Konstruktaktivität an einem EWS/FLI (C) aktivierten Zielgen, NR0B1, und (D) unterdrücktem Zielgen, TGFBR2, durch qRT-PCR. Die Daten werden als mittlere +/- Standardabweichung dargestellt. P-Werte wurden mit einem tukey's honest significance test berechnet. * p < 0,05, ** p < 0,01, *** p < 0,005 (E) Koloniezählungen aus Soft-Agar-Assays, die zur Beurteilung der Transformationsaktivität von Konstrukten durchgeführt wurden. P-Werte wurden mit einem tukey's honest significance test berechnet. * S. < 0,05, ** S. < 0,01, *** S. < 0,005. Diese Abbildung stammt aus Theisen, et al.23Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.
Abbildung 3: Endgültige zusammengestellte Zähldaten für die Analyse. Screenshot der ersten 6 Zeilen der Zähldatei mit Genzählungen für alle Proben, die batch normalisiert und analysiert werden sollen. Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.
Abbildung 4: Heatmaps der Sample-to-Sample-Entfernung. (A) Stichproben-zu-Stichproben-Entfernungsdiagramm, das die Stichproben-Clusterung der Rohzählungsdaten zeigt. Proben, die sowohl nach Batch als auch nach Stichprobe gruppiert sind, sind mit roten Pfeilen gekennzeichnet. (B) Stichproben-zu-Stichproben-Abstandsdiagramm nach Batch-Normalisierung mit ComBat. Hier gruppieren sich Samples aus allen Replikaten, unabhängig vom Batch. Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.
Abbildung 5: Ergebnisse der Differentialexpressionsanalyse. (A) Das Diagramm der Prinzipkomponentenanalyse (PCA) der transkriptomischen Signaturen, die für alle Proben generiert wurden, zeigt eine starke Intra-Stichproben-Clusterbildung und zeigt, dass DAF zwischen den positiven (wtEF) und negativen (Δ22) Kontrollen intermediär ist. (B) Vulkandiagramme, die den -log(p-Wert) zeigen, der gegen den log2FoldChange für Gene in jedem Konstrukt aufgetragen wird. Gene mit einem angepassten p-Wert < 0,05 und einem |log2(FoldChange)| > 1 gelten als signifikant und sind rot dargestellt. Panel 5B ist adaptiert von Theisen, et al.23Bitte klicken Sie hier, um eine größere Version dieser Abbildung zu sehen.
Abbildung 6: Hierarchisches Clustering zur Identifizierung von Genklassen. (A) Hierarchische Clusterbildung der 1000 am meisten variablen Gene über alle Konstrukte hinweg und die Baseline, iEF, zeigt, dass DAF die EWS/FLI-vermittelte Genaktivierung teilweise rettet. (B) Genontologie (molekulare Funktion) resultiert aus ToppGene, die die funktionelle Anreicherung von EWS/FLI-aktivierten Genen zeigen, die entweder durch DAF gerettet oder nicht gerettet werden. Panel 6B ist adaptiert von Theisen, et al.23Bitte klicken Sie hier, um eine größere Version dieser Abbildung zu sehen.
Abbildung 7: Detaillierte Analyse verschiedener Transkriptionsfaktor-Antwortelemente auf verschiedene Konstrukte: (A) Schematische Darstellung der Datenverarbeitung, die zur Generierung von Panels (B) und (C) verwendet wird, indem andere verfügbare Datensätze mit den transkriptomischen Profilen hier integriert werden. (B,C) Zusammenstellung, die die Rettung verschiedener Klassen von direkten EWS/FLI- (B) aktivierten und (C) unterdrückten Zielen zeigt. Eingeschlossen waren nur gene mit nachweisbarer differentieller Expression durch endogenes EWS/FLI. In jedem Kreisdiagramm zeigt Grau den Teil der Gene an, die nicht durch das Konstrukt gerettet werden. Rot stellt den Anteil der Gene dar, die differentiell aktiviert sind, und Blau stellt den Anteil der Gene dar, die differentiell unterdrückt werden. Diese Abbildung stammt aus Theisen, et al.23Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.
Abbildung S1: Laden der fastq.gz-Dateien in die HPC-Umgebung, Trimmen und Ausrichten. Bitte klicken Sie hier, um diese Abbildung herunterzuladen.
Abbildung S2: Sortieren von Lesezahlen über Stichproben hinweg und Ausführen der Batchnormalisierung mit ComBat. Bitte klicken Sie hier, um diese Abbildung herunterzuladen.
Abbildung S3: Ausführen von DESeq2 und Extrahieren der Ergebnisse der Differentialexpressionsanalyse. Bitte klicken Sie hier, um diese Abbildung herunterzuladen.
Abbildung S4: Analyse der Ausgabe. Bitte klicken Sie hier, um diese Abbildung herunterzuladen.
Abbildung S5: Hierarchisches Clustering zur Identifizierung von Genklassen: Hierarchisches Clustering der Top 1000 der meisten variablen Gene über alle Konstrukte hinweg und die Baseline, iEF, sortiert in k Cluster. In diesem Fall ist k=7, aber dieser Parameter wird vom Benutzer festgelegt, wie in Abbildung S4Dgezeigt. Bitte klicken Sie hier, um diese Abbildung herunterzuladen.
Tabelle S1: Liste der Gene (Ensembl-Gen-ID) mit Clusterannotation. Bitte klicken Sie hier, um diese Tabelle herunterzuladen.
Die Untersuchung der biochemischen Mechanismen onkogener Transkriptionsfaktoren ist von entscheidender Bedeutung, um die von ihnen verursachten Krankheiten zu verstehen und neue therapeutische Strategien zu entwickeln. Dies gilt insbesondere für Malignome, die durch chromosomale Translokationen gekennzeichnet sind, die zu Fusionstranskriptionsfaktoren führen. Den domänen, die in diesen chimären Proteinen enthalten sind, könnten sinnvolle Wechselwirkungen mit regulatorischen Domänen in den Wildtypproteinen fehlen, was die Fähigkeit erschwert, Strukturfunktionsinformationen im Kontext der Fusion zu interpretieren26,27,28. Darüber hinaus sind viele dieser onkogenen Fusionen durch intrinsisch ungeordnete Domänen mit geringer Komplexität gekennzeichnet10,13,29,30.
Die EWS-Domäne ist ein Beispiel für eine solche intrinsisch ungeordnete Domäne, die an einer Vielzahl von onkogenen Fusionen beteiligt ist10. Die intrinsisch ungeordnete und sich wiederholende Natur hat die Bemühungen behindert, die molekularen Mechanismen der EWS-Domäne zu verstehen. Frühere Bemühungen, die Strukturfunktion zu untersuchen, haben weitgehend auf die Verwendung verschiedener Mutanten im Kontext von Reportergen-Assays oder in Zellhintergründen zurückgegriffen, die den relevanten zellulären Kontext nicht rekapitulieren oder keine strukturellen Variationen aufweisen, die eine sinnvolle Teilfunktion erzeugen11,17,25. Die hier vorgestellte Methode befasst sich mit diesen Problemen. Das Struktur-Funktions-Mapping wird in einem krankheitsrelevanten Zellkontext durchgeführt, und die Sequenzierung der nächsten Generation ermöglicht die transkriptomische Profilierung, um die Transkriptionsfaktorfunktion im Setting des nativen Chromatins zu bewerten. Im speziellen Fall der DAF-Mutante von EWS/FLI wurde berichtet, dass DAF in Reporterassays mit isolierten Antwortelementen wenig Aktivität zeigte, aber Aktivität im Kontext des vollständigen Genpromotors zeigte, entweder in einem Reporter-Assay oder in nativem Chromatin, was auf einen interessanten Phänotyp23hindeutet. Die Verwendung der hier beschriebenen Methode löst direkter die Frage, welche Art von regulatorischen Elementen im gesamten Genom im Krankheitsumfeld am besten anspricht. Durch das gleichzeitige Testen aller Kandidaten-Zielgene in ihrem nativen Chromatinkontext ist es wahrscheinlicher, dass ein transkriptomischer Ansatz Konstrukte mit Partieller Funktion identifiziert.
Die inhärente Stärke der Verwendung eines krankheitsrelevanten Zellhintergrunds ist vielleicht die größte Einschränkung dieser Technik. Einer der wichtigsten Faktoren ist die Auswahl des geeigneten Zellsystems für diese Experimente. Viele Zelllinien, die von Malignomen mit pathognomonischen Transkriptionsfaktoren abgeleitet sind, tolerieren den Knockdown dieses Transkriptionsfaktors nicht ohne weiteres, und in vielen Fällen, insbesondere bei pädiatrischen Krebsarten, bleibt die wahre Ursprungszelle umstritten und die Expression des Onkogens in anderen Zellhintergründen ist unerschwinglich toxisch31,32 . In diesen Fällen kann es hilfreich sein, Experimente in einem anderen Zellhintergrund durchzuführen, solange der Forscher bei der Interpretation der Ergebnisse Vorsicht walten lässt und relevante Befunde in einem krankheitsrelevanteren Zelltyp entsprechend validiert.
Es ist von entscheidender Bedeutung, die Stabilität und die phänotypischen Folgen der Expression des Onkogens sorgfältig zu validieren und nur Proben zur Sequenzierung einzureichen, die strenge Kriterien erfüllen. Dazu gehörten Western Blot zur Bestätigung von Knockdown und Rettung sowie qRT-PCR einer kleinen Anzahl bekannter Zielgene zur Validierung der Positivkontrolle (Abbildung 2). Ebenso ist es wichtig, die Chargenvariabilität so gering wie möglich zu halten, indem die Zell- und RNA-Präparationen in jeder Charge so ähnlich wie möglich durchgeführt werden.
Die hier beschriebene Methode wird besonders leistungsfähig, wenn sie mit anderen Arten von genomischen Daten gepaart wird, die auf die genomweite Funktion des untersuchten Transkriptionsfaktors hinweisen. Zukünftige Richtungen für diese Art der Struktur-Funktions-Analyse würden sich um ChIP-seq und ATAC-seq erweitern, um die Bindung des Transkriptionsfaktors und alle induzierten Veränderungen der Chromatin-Zugänglichkeit zu bestimmen. Als Suite kann diese Art von Daten darauf hinweisen, wo verschiedene strukturelle Komponenten eines onkogenen Transkriptionsfaktors zu verschiedenen Aspekten der Funktion beitragen (z. B. DNA-Bindung vs. Chromatinmodifikation vs. Co-Regulator-Rekrutierung). Insgesamt kann die Verwendung von NGS-basierten Ansätzen zur Abbildung der Struktur-Funktions-Beziehungen von Fusionstranskriptionsfaktoren neue Erkenntnisse über die biochemischen Determinanten der onkogenen Funktion dieser Proteine liefern. Dies ist wichtig, um das Verständnis der von ihnen verursachten Krankheiten zu fördern und die Entwicklung neuer therapeutischer Strategien zu ermöglichen.
SLL erklärt einen Interessenkonflikt als Mitglied des Beirats und Anteilseigner von Salarius Pharmaceuticals. SLL ist auch ein gelisteter Erfinder auf United States Patents No. US 7,393,253 B2, "Methods and compositions for the diagnosis and treatment of Ewing's sarcoma", und US 8,557,532, "Diagnosis and treatment of drug-resistant Ewing's sarcoma". Dies ändert nichts an unserer Einhaltung der JoVE-Richtlinien zur Weitergabe von Daten und Materialien.
Diese Forschung wurde von der High Performance Computing Facility am Abigail Wexner Research Institute am Nationwide Children's Hospital unterstützt. Diese Arbeit wurde von den National Institutes of Health National Cancer Institute [U54 CA231641 zu SLL, R01 CA183776 zu SLL] unterstützt; Alex's Lemonade Stand Foundation [Young Investigator Award an ERT]; Pelotonia [Stipendium für ERT]; und das National Health and Medical Research Council CJ Martin Overseas Biomedical Fellowship [APP1111032 an KIP].
Name | Company | Catalog Number | Comments |
Wet Lab Reagents | |||
anti-FLI rabbit pAb | Abcam | ab15289 | 1:500 |
anti-lamin B1 rabbit pAb | Abcam | ab16048 | 1:2000 |
Cell-based system for introduction of mutant constructs | Determined by cell system used | ||
Cryotubes | For viral aliquots | ||
DMEM | Corning Cellgro | 10-013-CV | For viral production |
Fetal bovine serum | Gibco | 16000-044 | For viral production |
G418 | ThermoFisher | 10131027 | For viral production |
HEK293-EBNAs | ATCC | CRL-10852 | For viral production |
HEPES | Gibco | 15630106 | |
Hygromycin B | ThermoFisher | 10687010 | |
M2 anti-FLAG mouse mAb | Sigma | F3165 | 1:2000 |
Near IR-secondary antibodies | Li-Cor | ||
Optimem | Gibco | 31985062 | For viral production |
Penicillin/Streptomycin/Glutamine | Gibco | 10378-016 | For viral production |
Polybrene | Sigma | TR-1003-G | For viral transduction |
Puromycin | Sigma | P8833 | Stored at 2 mg/mL stock |
RNeasy Plus kit | Qiagen | 74136 | Has gDNA removal columns |
Selection reagents | As dictated by cell system used | ||
Sodium Pyruvate | Gibco | 11360-070 | For viral production |
Tissue culture media | Determined by cell system used | ||
TransIT-LT1 | Mirus | MIR 2304 | For viral production |
Software | |||
Access to HPC environment | |||
AnnotationDbi | 1.38.2 | ||
Cairo | 1.5-10 | ||
DESeq2 | 1.16.1 | ||
genefilter | 1.58.1 | ||
ggbiplot | 0.55 | ||
ggplot2 | 3.1.1 | ||
org.Hs.eg.db | 3.4.1 | ||
pheatmap | 1.0.12 | ||
PuTTY | |||
R | 3.4.0 | ||
RColorBrewer | 1.1-2 | ||
reshape2 | 1.4.3 | ||
rgl | 0.100.19 | ||
R-studio | |||
STAR | Version 2.6 or later | ||
sva | 3.24.4 | ||
TrimGalore! | |||
WinSCP |
Genehmigung beantragen, um den Text oder die Abbildungen dieses JoVE-Artikels zu verwenden
Genehmigung beantragenThis article has been published
Video Coming Soon
Copyright © 2025 MyJoVE Corporation. Alle Rechte vorbehalten