Method Article
Les domaines intrinsèquement désordonnés sont importants pour la fonction du facteur de transcription de fusion oncogène. Pour cibler thérapeutiquement ces protéines, une compréhension plus détaillée des mécanismes de régulation employés par ces domaines est nécessaire. Ici, nous utilisons la transcriptomique pour cartographier les caractéristiques structurelles importantes du domaine EWS intrinsèquement désordonné dans le sarcome d’Ewing.
De nombreux cancers sont caractérisés par des translocations chromosomiques qui entraînent l’expression de facteurs de transcription de fusion oncogène. Typiquement, ces protéines contiennent un domaine intrinsèquement désordonné (IDD) fusionné avec le domaine de liaison à l’ADN (DBD) d’une autre protéine et orchestrent des changements transcriptionnels généralisés pour favoriser la malignité. Ces fusions sont souvent la seule aberration génomique récurrente dans les cancers qu’elles provoquent, ce qui en fait des cibles thérapeutiques attrayantes. Cependant, le ciblage des facteurs de transcription oncogènes nécessite une meilleure compréhension du rôle mécaniste que jouent les IDD de faible complexité dans leur fonction. Le domaine N-terminal d’EWSR1 est un IDD impliqué dans une variété de facteurs de transcription de fusion oncogénique, y compris EWS / FLI, EWS / ATF et EWS / WT1. Ici, nous utilisons le séquençage de l’ARN pour étudier les caractéristiques structurelles du domaine EWS importantes pour la fonction transcriptionnelle de EWS / FLI dans le sarcome d’Ewing. La première déplétion médiée par l’ARNh de la fusion endogène des cellules du sarcome d’Ewing associée à l’expression ectopique d’une variété de constructions mutantes EWS est effectuée. Ensuite, le séquençage de l’ARN est utilisé pour analyser les transcriptomes des cellules exprimant ces constructions afin de caractériser les déficits fonctionnels associés aux mutations dans le domaine EWS. En intégrant les analyses transcriptomiques aux informations précédemment publiées sur les motifs de liaison à l’ADN EWS / FLI et la localisation génomique, ainsi qu’aux tests fonctionnels pour la capacité de transformation, nous avons pu identifier les caractéristiques structurelles de EWS / FLI importantes pour l’oncogenèse et définir un nouvel ensemble de gènes cibles EWS / FLI essentiels pour le sarcome d’Ewing. Cet article démontre l’utilisation du séquençage de l’ARN comme méthode pour cartographier la relation structure-fonction du domaine intrinsèquement désordonné des facteurs de transcription oncogènes.
Un sous-ensemble de cancers, comprenant de nombreuses tumeurs malignes de l’enfance et de l’adolescence, sont caractérisés par des translocations chromosomiques qui génèrentde nouvelles oncogènes de fusion1,2,3,4,5,6. Les protéines de fusion résultantes fonctionnent fréquemment comme des facteurs de transcription oncogènes, orchestrant des changements généralisés dans la régulation transcriptionnelle pour favoriser la tumorigenèse7,8. Les cancers avec ces translocations possèdent généralement un paysage mutationnel par ailleurs calme, avec peu d’aberrations génomiques récurrentes en dehors de la fusion pathognomonique4,9. En tant que tel, cibler directement la protéine de fusion est une stratégie thérapeutique attrayante dans ces maladies. Cependant, ces facteurs de transcription oncogènes consistent généralement en un domaine de faible complexité, intrinsèquement désordonné, activant la transcription fusionné avec un domaine de liaison à l’ADN (DBD)10,11,12,13,14. Les domaines intrinsèquement désordonnés (IDD) et les DBD de ces protéines se sont révélés difficiles à cibler avec les approches pharmacologiques conventionnelles. Le développement de nouvelles approches thérapeutiques nécessite donc une compréhension moléculaire plus détaillée des mécanismes employés par ces fusions pour réguler aberrantement l’expression des gènes.
La partie N-terminale IDD d’EWSR1 est couramment fusionnée à un DBD dans le cancer, y compris EWS / FLI dans le sarcome d’Ewing, EWS / WT1 dans la tumeur diffuse à petites cellules rondes et EWS / ATF1 dans le sarcome à cellules claires des parties molles10. Le rôle mécaniste de l’EWS IDD dans chacune de ces fusions n’est pas bien compris. La famille de fusions EWS/ETS, en particulier EWS/FLI, est la plus fonctionnellement caractérisée à ce jour. EWS/FLI coordonne les changements épigénétiques et transcriptionnels à l’échelle du génome conduisant à l’activation et à la répression de milliers de gènes7,11,15,16. Des études ont montré que l’IDD est important pour le recrutement des co-activateurs transcriptionnels (tels que p300, WDR5 et le complexe BAF), ainsi que des co-répresseurs (tels que le complexe NuRD)11,15,17. La fusion de l’IDD EWS à la partie C-terminale de FLI1 confère une nouvelle spécificité de liaison à l’ADN au DBD ETS de FLI1, de sorte que l’oncoprotéine de fusion (EWS / FLI) se lie aux régions répétitives GGAA-microsatellites du génome en plus du motif ETS consensuel18,19,20. Combinée à la fonction de recrutement de co-activateurs, cette activité émergente de liaison à l’ADN de l’EWS/FLI favorise la formation d’amplificateurs de novo au niveau des microsatellites GGAA distaux aux sites de départ de transcription (TSS) (microsatellites de type amplificateur) et recrute l’ARN polymérase II pour favoriser la transcription au niveau des microsatellites GGAA-microsatellites proximaux au TSS (microsatellites de type promoteur)11,15,16,21.
Prises ensemble, ces données nous ont amenés à émettre l’hypothèse que des éléments discrets au sein du domaine EWS contribuent au recrutement de co-régulateurs distincts pour différents types de sites de liaison EWS/FLI. Cependant, le discernement de ces éléments dans la partie EWS de EWS /FLI, et leur fonctionnement, a été entravé par la nature hautement répétitive et désordonnée du domaine. Ici, nous utilisons un système de sauvetage précédemment publié dans les cellules du sarcome d’Ewing pour cartographier fonctionnellement ces éléments dans l’IDD EWS. Dans ce système, EWS/FLI est épuisé à l’aide d’un shRNA ciblant le 3'UTR du gène FLI1, et l’expression est sauvée avec différentes constructions d’ADNc mutantes EWS/FLI dépourvues du 3'UTR7,17,22. Ces expériences se sont concentrées sur des constructions avec diverses délétions pour cartographier la relation structure-fonction entre l’IDD EWS et d’importants phénotypes oncogènes, y compris l’activation d’une construction de rapporteur GGAA-microsatellite, les essais de formation de colonies et la validation ciblée des gènes activés et réprimés EWS /FLI 7,17,22 . Cependant, ces études n’ont pas réussi à trouver des sous-domaines discrets au sein de l’IDD EWS dans EWS / FLI qui sont particulièrement importants pour l’activation ou la répression. Toutes les constructions testées étaient soit capables d’activer et de réprimer des gènes cibles spécifiques, conduisant à une formation efficace de colonies, soit incapables de réguler l’un des gènes cibles EWS / FLI, entraînant la perte de la formation de colonies7,17,22.
Les analyses transcriptomiques rendues possibles par l’adoption généralisée du séquençage de nouvelle génération sont couramment utilisées pour comparer les signatures d’expression génique dans deux conditions, souvent dans le cadre d’études de dépistage ou descriptives. Nous voulions plutôt tirer parti de la capacité de capturer des données d’expression à l’échelle du génome en utilisant le séquençage de l’ARN (séquençage de l’ARN) pour caractériser les contributions des IDD à la fonction du facteur de transcription. Dans ce cas, RNA-seq est associé au système knockdown-rescue pour explorer la relation structure-fonction du domaine EWS. Cette approche est applicable à d’autres facteurs de transcription de fusion, y compris d’autres fusions EWS ou facteurs de transcription de type sauvage avec une fonction mal comprise, et présente de multiples avantages par rapport aux autres tests utilisés pour les études de cartographie fonctionnelle, tels que les tests rapporteurs ou la qRT-PCR ciblée. Il s’agit notamment de tester les déterminants structurels de la fonction dans le contexte pertinent de la chromatine, la capacité de tester plusieurs types d’éléments de réponse dans un seul essai (c.-à-d. activé et réprimé, microsatellite GGAA et non microsatellite, etc.), et la capacité qui en résulte de mieux détecter la fonction partielle.
La mise en œuvre réussie de cette approche dépend d’un système cellulaire qui capture les phénotypes d’intérêt (dans ce cas, les cellules A673 avec épuisement EWS/FLI médié par l’ARNh), et d’un panel de constructions mutantes dans un vecteur d’expression approprié pour le système cellulaire (dans ce cas, pMSCV-hygro avec divers mutants EWS/FLI marqués 3x-FLAG à délivrer par transduction rétrovirale). La transduction virale des constructions d’épuisement basées sur CRISPR, des constructions d’épuisement basées sur shRNA et des constructions d’expression de l’ADNc avec une sélection appropriée pour générer des lignées cellulaires stables est recommandée par transfection transitoire. L’interprétation en aval des résultats est renforcée lorsque les données transcriptomiques peuvent être associées à d’autres données liées à la localisation du facteur de transcription et à d’autres lectures phénotypiques, le cas échéant.
Dans cet article, nous appliquons cette approche pour caractériser l’activité du mutant DAF d’EWS/FLI14. Le mutant DAF présente 17 mutations tyrosine à alanine dans les régions répétitives de l’IDD EWS de EWS/FLI14. Ce mutant EWS particulier avait déjà été signalé et est incapable d’activer l’expression du gène rapporteur lorsqu’il est fusionné à l’ATF1 DBD14. Cependant, les données préliminaires de qRT-PCR suggèrent que ce mutant était capable d’activer la transcription de la cible EWS/FLI NR0B123. L’approche transcriptomique décrite ici a permis de détecter avec succès la fonction partielle du mutant DAF. En associant ces données transcriptomiques à des informations sur les motifs de liaison et de reconnaissance EWS/FLI, nous montrons en outre que le mutant DAF conserve sa fonction lors des répétitions de microsatellites GGAA. Ces résultats identifient le DAF comme le premier mutant EWS/FLI partiellement fonctionnel et mettent en évidence la fonction des gènes non microsatellites comme étant important pour l’oncogenèse (comme indiqué23). Cela démontre la puissance de cette approche de cartographie transcriptomique structure-fonction pour fournir un aperçu de la fonction des facteurs de transcription oncogènes.
1. Mettre en place un panel in vitro de constructions
REMARQUE: Cette étape variera en fonction de la protéine spécifique à analyser.
2. Collecter des cellules, valider l’expression des constructions et mettre en place des tests phénotypiques corrélatifs
3. Séquençage de nouvelle génération
4. Pipeline d’alignement et de comptage des transcriptions
Remarque : Ce protocole suppose qu’après la soumission et le traitement de l’exemple, un ensemble de fichiers FASTQ appariés est renvoyé pour chaque échantillon. Ces fichiers sont fréquemment compressés avec un suffixe de « fastq.gz ». Une analyse plus approfondie de ces fichiers FASTQ nécessitera l’accès à une installation de calcul haute performance (HPC) exécutant un système d’exploitation Linux.
5. Expression différentielle et analyse en aval
6. Comparaison avec les phénotypes pertinents
Les données préliminaires de qRT-PCR ont suggéré qu’un mutant EWS/FLI appelé DAF, avec des mutations spécifiques de tyrosine à alanine dans la région répétitive et désordonnée de EWS, maintenait la capacité d’activer les gènes cibles EWS/FLI, mais ne parvenait pas à réprimer les gènes cibles critiques23. Afin de mieux comprendre la relation entre ces résidus dans le domaine EWS et la fonction EWS/FLI, le protocole décrit ci-dessus et décrit à la figure 1 a été utilisé. Les cellules du sarcome d’Ewing A673 ont été transduites viralement avec un shRNA ciblant le 3'UTR de FLI1,ce qui a entraîné l’épuisement des EWS/FLI endogènes. Après quatre jours de sélection, la fonction EWS /FLI a été sauvée avec la transduction virale de différentes constructions mutantes EWS/FLI marquées 3XFLAG, avec un vecteur vide comme contrôle de l’absence de sauvetage. Un mutant non fonctionnel dépourvu du domaine EWS, appelé Δ22, a été utilisé comme témoin négatif et un EWS/FLI de type sauvage, appelé wtEF, a été utilisé comme témoin positif(Figure 2A). DAF a été utilisé comme construction de test, bien que plus d’une construction de test puisse être utilisée si vous le souhaitez. Les cellules ont été sélectionnées pendant 10 jours supplémentaires pour permettre à l’expression de la construction de se stabiliser, puis collectées pour l’ARN (avec une étape d’élimination de l’ADNg), les tests de formation de protéines et de colonies. Quatre répliques ont été recueillies et des qRT-PCR représentatives et des transferts occidentaux montrant un renversement et un sauvetage efficaces sont représentés à la figure 2B-D. Il convient de noter que les cellules sauvées par le DAF n’ont pas réussi à former des colonies, comme le montre la figure 2E,ce qui suggère une altération de la transformation oncogénique.
Après l’achèvement de la validation répliquée et des tests phénotypiques, l’ARN a été soumis à l’Institut de médecine génomique du Nationwide Children’s Hospital pour la préparation de la bibliothèque et le séquençage de nouvelle génération avec environ 50 millions de lectures appariées de 150 pb collectées. Les données ont été renvoyées sous forme de fichiers fastq.gz. Les lectures de mauvaise qualité ont été coupées à partir de ces fichiers avec TrimGalore et STAR a été utilisé pour aligner les lectures sur le génome humain hg19 et compter les lectures par gène. hg19 a été utilisé à des fins de compatibilité avec les autres ensembles de données organisés pour EWS/FLI utilisés dans l’analyse en aval. Ces comptages de lecture ont été combinés en une seule matrice de comptage pour tous les échantillons, dont les 6 premières lignes sont illustrées à la figure 3.
Les comptages ont d’abord été effectués à travers DESeq2 sans normalisation de lot, cependant, l’inspection visuelle de la distance d’échantillon à échantillon a montré des effets de lot potentiellement confondants, comme le montrent des flèches rouges à la figure 4A. Cela est probablement dû à la variabilité biologique introduite par le passage des cellules en culture et aux différences dans le traitement de chaque lot. La normalisation des effets de lot a été effectuée avec ComBat et est généralement recommandée. Les distances d’échantillon à échantillon des données normalisées par lots sont illustrées à la figure 4B. Après la normalisation par lots, DESeq2 a été utilisé pour générer des profils transcriptionnels pour les trois constructions (wtEF, Δ22 et DAF) par rapport à la ligne de base. Notez que bien que les cellules A673 « parentales » (simulation de renversement et de sauvetage simulé, appelées « iLuc » ici) aient été incluses dans l’analyse différentielle, la référence pour cette expérience sont les cellules avec des cellules appauvries en EWS / FLI, appelées cellules iEF. Le profil transcriptionnel peut être généré pour la protéine endogène ici en comparant l’échantillon iLuc à l’iEF, ce qui peut être intéressant pour comprendre le fonctionnement du système de sauvetage, mais ce n’est pas le but de cette analyse particulière. Les profils transcriptionnels générés pour les mutants comprennent des contrôles positifs (wtEF) et négatifs (Δ22), en ce qui concerne l’iEF, de sorte que ceux-ci devraient servir de repères pour d’autres mutants. Ceci est important, car le contrôle positif dans cet exemple n’a pas complètement récapitulé la fonction de l’EWS/FLI endogène comme discutéailleurs 7,23.
L’analyse en composantes principales (ACP) de la figure 5 suggère que le profil transcriptionnel du DAF est intermédiaire entre wtEF et Δ22, confirmant la fonction partielle. De plus, le regroupement hiérarchique des 1000 gènes les plus variables sur les échantillons a montré que le DAF n’a pas réussi à réprimer les gènes cibles EWS/FLI et n’a que partiellement conservé l’activité d’activation des gènes, comme le montrent les figures 6A et S5. L’analyse de ToppGene a suggéré que les classes de gènes que DAF active sont fonctionnellement distinctes des cibles activées par EWS / FLI où DAF n’est pas fonctionnel (Figure 6B). Fait intéressant, la fonction des gènes activés sauvés par wtEF, mais pas par DAF, semble être liée au contrôle transcriptionnel et à la régulation de la chromatine. Sur la base des résultats des essais de formation de colonies, les gènes de cette signature génétique de base devraient être analysés plus en détail pour leur rôle dans l’oncogenèse médiée par EWS / FLI. L’importance de la répression génique médiée par EWS/FLI a déjà été décrite17.
On sait que EWS/FLI possède une affinité de liaison unique pour les éléments répétitifs GGAA-microsatellites19,22, et que la liaison à ces éléments entraîne la régulation génique en aval11,15,18,20,22. Ces microsatellites ont été caractérisés comme étant soit associés à l’activation ou à la répression, et soit proximaux au TSS (< 5 kb), soit distaux au (> 5 kb) TSS25. En outre, il existe des gènes régulés EWS / FLI avec des motifs ETS à haute affinité (HA) proximaux à TSS23. Afin d’analyser davantage les caractéristiques de la fonction DAF et les types de gènes activés par EWS / FLI que DAF a pu sauver, l’expression différentielle des gènes associés à ces différentes classes a été analysée. Fait intéressant, DAF a été le plus en mesure de sauver les gènes activés par microsatellite GGAA, mais incapable de sauver les gènes activés près d’un site HA comme le montre la figure 7. Comme on l’a vu avec le regroupement hiérarchique, DAF ne parvient pas à sauver la répression médiée par EWS / FLI à travers les classes de motifs. Ces données suggèrent que le DAF conserve suffisamment de caractéristiques structurelles de l’EWS pour se lier et s’activer à partir des microsatellites GGAA, à la fois proximaux et distaux au TSS. Cela provient probablement du domaine SYGQ intact considéré comme important pour l’activité EWS / FLI à GGAA répète11. Ces données suggèrent également que les tyrosines spécifiques mutées dans le DAF jouent des rôles importants, mais mal compris, dans la régulation des gènes médiée par EWS / FLI à partir des sites HA, ainsi que dans la répression des gènes, mettant en évidence un domaine important d’investigation supplémentaire.
Figure 1 : Flux de travail. Représentation de la procédure étape par étape pour effectuer un mappage structure-fonction par transcriptomique. Les cellules ont d’abord été préparées pour exprimer la suite de constructions requises pour la cartographie structure-fonction. Après l’expression, les cellules ont été récoltées pour l’ARN et les protéines et testées pour les phénotypes corrélatifs. L’expression des constructions a été validée, et ce processus a été répété 3-4 fois pour recueillir des répliques biologiques indépendantes. L’ARN a ensuite été soumis au séquençage de nouvelle génération (NGS). Lorsque les données ont été reçues, les données ont été ajustées pour la qualité, alignées et le nombre de transcriptions a été calculé. Les effets des lots ont été contrôlés et les signatures transcriptomiques et l’expression différentielle ont été déterminées à l’aide de DESeq2. Le clustering hiérarchique et l’analyse en aval intégrant d’autres ensembles de données -omiques et différentes analyses de chemin ou fonctionnelles peuvent être incorporés. Veuillez cliquer ici pour voir une version agrandie de cette figure.
Figure 2 : Validation de l’expression de construction et des essais corrélatifs. (A) Schéma représentant les constructions testées dans cet exemple. (B) Validation de l’élimination des EWS/FLI endogènes et expression des constructions marquées 3X-FLAG par immunoblot. (C,D) Validation de l’activité de construction d’un gène cible activé EWS/FLI(C), NR0B1,et(D)gène cible réprimé, TGFBR2,par qRT-PCR. Les données sont présentées sous forme d’écart-type moyen +/-. Les valeurs de P ont été calculées avec un test de signification honnête de Tukey. * p < 0,05, ** p < 0,01, *** p < 0,005 (E) Nombre de colonies à partir d’essais de gélose molle effectués pour évaluer l’activité de transformation des constructions. Les valeurs de P ont été calculées avec un test de signification honnête de Tukey. * p < 0,05, ** p < 0,01, *** p < 0,005. Cette figure est adaptée de Theisen, et al.23Veuillez cliquer ici pour voir une version plus grande de cette figure.
Figure 3 : Données finales de comptage rassemblées pour analyse. Capture d’écran des 6 premières lignes du fichier de comptage avec les numérations de gènes pour tous les échantillons à normaliser et à analyser par lots. Veuillez cliquer ici pour voir une version agrandie de cette figure.
Figure 4 : Cartes thermiques de distance d’échantillon à échantillon. (A) Graphique de distance d’échantillon à échantillon montrant le regroupement d’échantillons des données de comptage brutes. Les échantillons qui se regroupent à la fois par lot et par échantillon sont signalés par des flèches rouges. (B) Diagramme de distance échantillon à échantillon suivant la normalisation du lot avec ComBat. Ici, les échantillons de toutes les répliques se regroupent ensemble, indépendamment du lot. Veuillez cliquer ici pour voir une version agrandie de cette figure.
Figure 5 : Résultats de l’analyse de l’expression différentielle. (A) Le diagramme d’analyse composante principale (APC) des signatures transcriptomiques générées pour tous les échantillons montre un fort regroupement intra-échantillon et démontre que le DAF est intermédié entre les témoins positifs (wtEF) et négatifs (Δ22). (B) Diagrammes de volcan montrant le -log(p-value) tracé par rapport au log2FoldChange pour les gènes dans chaque construction. Gènes avec une valeur de p ajustée < 0,05 et une |log2(FoldChange)| > 1 sont considérés comme significatifs et sont indiqués en rouge. Le panneau 5B est adapté de Theisen, et al.23Veuillez cliquer ici pour voir une version plus grande de cette figure.
Figure 6 : Regroupement hiérarchique pour identifier les classes de gènes. (A) Le regroupement hiérarchique des 1000 gènes les plus variables dans toutes les constructions et la ligne de base, iEF, montre que DAF sauve partiellement l’activation génique médiée par EWS / FLI. (B) Résultats de l’ontologie génique (fonction moléculaire) de ToppGene montrant l’enrichissement fonctionnel des gènes activés par EWS / FLI qui sont sauvés ou non sauvés par DAF. Le panneau 6B est adapté de Theisen, et al.23Veuillez cliquer ici pour voir une version plus grande de cette figure.
Figure 7: Analyse détaillée de différents éléments de réponse du facteur de transcription à différentes constructions: (A) Schéma illustrant le traitement des données utilisé pour générer des panels (B) et (C) en incorporant d’autres ensembles de données disponibles avec les profils transcriptomiques ici. (B,C) Compilation montrant le sauvetage de différentes classes de cibles directes EWS/FLI- (B) activées et (C) réprimées. Les gènes inclus n’étaient que les gènes dont l’expression différentielle était détectable par EWS/FLI endogène. Dans chaque diagramme à secteurs, le gris représente la partie des gènes qui ne sont pas sauvés par la construction. Le rouge représente la partie des gènes qui sont activés différentiellement, et le bleu représente la partie des gènes qui sont réprimés différentiellement. Cette figure est adaptée de Theisen, et al.23Veuillez cliquer ici pour voir une version plus grande de cette figure.
Figure S1 : Chargement des fichiers fastq.gz dans l’environnement HPC, rognage et alignement. Veuillez cliquer ici pour télécharger cette figure.
Figure S2 : Regroupement des nombres de lectures entre les échantillons et exécution de la normalisation des lots avec ComBat. Veuillez cliquer ici pour télécharger cette figure.
Figure S3 : Exécution de DESeq2 et extraction des résultats de l’analyse de l’expression différentielle. Veuillez cliquer ici pour télécharger cette figure.
Figure S4 : Analyse de la sortie. Veuillez cliquer ici pour télécharger cette figure.
Figure S5 : Regroupement hiérarchique pour identifier les classes de gènes : Regroupement hiérarchique des 1000 gènes les plus variables dans toutes les constructions et la base de référence, iEF, triée en k clusters. Dans ce cas, k= 7, mais ce paramètre est défini par l’utilisateur comme illustré à la figure S4D. Veuillez cliquer ici pour télécharger cette figure.
Tableau S1 : Liste des gènes (ID du gène Ensembl) avec annotation de cluster. Veuillez cliquer ici pour télécharger ce tableau.
L’étude des mécanismes biochimiques des facteurs de transcription oncogéniques est d’une importance cruciale pour comprendre les maladies qu’ils causent et pour concevoir de nouvelles stratégies thérapeutiques. Cela est particulièrement vrai dans les tumeurs malignes caractérisées par des translocations chromosomiques entraînant des facteurs de transcription de fusion. Les domaines inclus dans ces protéines chimériques peuvent manquer d’interactions significatives avec les domaines régulateurs présents dans les protéines de type sauvage, ce qui complique la capacité d’interpréter les informations structure-fonction dans le contexte de la fusion26,27,28. De plus, beaucoup de ces fusions oncogènes sont caractérisées par des domaines intrinsèquement désordonnés de faible complexité10,13,29,30.
Le domaine EWS est un exemple d’un tel domaine intrinsèquement désordonné qui est impliqué dans une variété de fusions oncogènes10. La nature intrinsèquement désordonnée et répétitive a entravé les efforts de compréhension des mécanismes moléculaires employés par le domaine EWS. Les efforts antérieurs pour étudier la structure-fonction ont largement eu recours à l’utilisation de différents mutants dans le contexte de tests de gènes rapporteurs ou dans des arrière-plans cellulaires qui ne parviennent pas à récapituler le contexte cellulaire pertinent, ou qui n’ont aucune variation structurelle produisant une fonction partielle significative11,17,25. La méthode présentée ici aborde ces questions. La cartographie structure-fonction est effectuée dans un contexte cellulaire pertinent pour la maladie et le séquençage de nouvelle génération permet le profilage transcriptomique pour évaluer la fonction du facteur de transcription dans le contexte de la chromatine native. Dans le cas spécifique du mutant DAF d’EWS/FLI, il a été rapporté que le DAF montrait peu d’activité dans les essais rapporteurs utilisant des éléments de réponse isolés, mais qu’il montrait une activité dans le contexte du promoteur complet du gène, soit dans un test rapporteur, soit dans la chromatine native, suggérant un phénotype23intéressant. L’utilisation de la méthode décrite ici résout plus directement la question de savoir quel type d’éléments régulateurs du génome sont les plus réactifs dans le contexte de la maladie. En testant simultanément tous les gènes cibles candidats dans leur contexte natif de chromatine, une approche transcriptomique est plus susceptible d’identifier des constructions à fonction partielle.
La force inhérente à l’utilisation d’un fond cellulaire pertinent pour la maladie est peut-être la plus grande limitation de cette technique. L’un des facteurs les plus importants est le choix du système cellulaire approprié pour ces expériences. De nombreuses lignées cellulaires dérivées de tumeurs malignes avec des facteurs de transcription pathognomoniques ne tolèrent pas facilement l’élimination de ce facteur de transcription et, dans de nombreux cas, en particulier pour les cancers pédiatriques, la véritable cellule d’origine reste controversée et l’expression de l’oncogène dans d’autres milieux cellulaires est prohibitivement toxique31,32 . Dans ces cas, il peut être utile d’effectuer des expériences dans un contexte cellulaire différent, à condition que le chercheur fasse preuve de prudence dans l’interprétation des résultats et valide de manière appropriée tout résultat pertinent dans un type de cellule plus pertinent pour la maladie.
Il est extrêmement important de valider soigneusement la stabilité et les conséquences phénotypiques de l’expression de l’oncogène et de ne soumettre que des échantillons pour le séquençage qui répondent à des critères stricts. Ici, cela comprenait le transfert western pour confirmer l’élimination et le sauvetage, et la qRT-PCR d’un petit nombre de gènes cibles connus pour valider le témoin positif(Figure 2). Il est également crucial de réduire autant que possible la variabilité des lots en effectuant soigneusement les préparations de cellules et d’ARN de la même manière que possible dans chaque lot.
La méthode décrite ici devient particulièrement puissante lorsqu’elle est associée à d’autres types de données génomiques qui parlent de la fonction pangénomique du facteur de transcription à l’étude. Les orientations futures de ce type d’analyse structure-fonction s’étendraient pour inclure ChIP-seq et ATAC-seq afin de déterminer la liaison du facteur de transcription et tout changement induit dans l’accessibilité de la chromatine. En tant que suite, ce type de données peut indiquer où différents composants structurels d’un facteur de transcription oncogénique contribuent à différents aspects de la fonction (c.-à-d. liaison à l’ADN vs modification de la chromatine vs recrutement co-régulateur). Dans l’ensemble, l’utilisation d’approches basées sur le NGS pour cartographier les relations structure-fonction des facteurs de transcription de fusion peut révéler de nouvelles connaissances sur les déterminants biochimiques de la fonction oncogène de ces protéines. Ceci est important pour approfondir notre compréhension des maladies qu’ils causent et pour permettre le développement de nouvelles stratégies thérapeutiques.
SLL déclare un conflit d’intérêts en tant que membre du conseil consultatif et actionnaire de Salarius Pharmaceuticals. SLL est également un inventeur répertorié sur les brevets américains No. US 7 393 253 B2, « Méthodes et compositions pour le diagnostic et le traitement du sarcome d’Ewing », et US 8 557 532, « Diagnostic et traitement du sarcome d’Ewing pharmacorésistant ». Cela ne modifie pas notre adhésion aux politiques de JoVE sur le partage de données et de matériaux.
Cette recherche a été soutenue par le High Performance Computing Facility de l’Abigail Wexner Research Institute du Nationwide Children’s Hospital. Ce travail a été soutenu par le National Institute of Health National Cancer Institute [U54 CA231641 à SLL, R01 CA183776 à SLL]; Alex’s Lemonade Stand Foundation [Prix du jeune chercheur à ERT]; Pelotonia [Bourse à l’ERT]; et la bourse biomédicale CJ Martin Overseas biomedical du Conseil national de la santé et de la recherche médicale [APP1111032 à KIP].
Name | Company | Catalog Number | Comments |
Wet Lab Reagents | |||
anti-FLI rabbit pAb | Abcam | ab15289 | 1:500 |
anti-lamin B1 rabbit pAb | Abcam | ab16048 | 1:2000 |
Cell-based system for introduction of mutant constructs | Determined by cell system used | ||
Cryotubes | For viral aliquots | ||
DMEM | Corning Cellgro | 10-013-CV | For viral production |
Fetal bovine serum | Gibco | 16000-044 | For viral production |
G418 | ThermoFisher | 10131027 | For viral production |
HEK293-EBNAs | ATCC | CRL-10852 | For viral production |
HEPES | Gibco | 15630106 | |
Hygromycin B | ThermoFisher | 10687010 | |
M2 anti-FLAG mouse mAb | Sigma | F3165 | 1:2000 |
Near IR-secondary antibodies | Li-Cor | ||
Optimem | Gibco | 31985062 | For viral production |
Penicillin/Streptomycin/Glutamine | Gibco | 10378-016 | For viral production |
Polybrene | Sigma | TR-1003-G | For viral transduction |
Puromycin | Sigma | P8833 | Stored at 2 mg/mL stock |
RNeasy Plus kit | Qiagen | 74136 | Has gDNA removal columns |
Selection reagents | As dictated by cell system used | ||
Sodium Pyruvate | Gibco | 11360-070 | For viral production |
Tissue culture media | Determined by cell system used | ||
TransIT-LT1 | Mirus | MIR 2304 | For viral production |
Software | |||
Access to HPC environment | |||
AnnotationDbi | 1.38.2 | ||
Cairo | 1.5-10 | ||
DESeq2 | 1.16.1 | ||
genefilter | 1.58.1 | ||
ggbiplot | 0.55 | ||
ggplot2 | 3.1.1 | ||
org.Hs.eg.db | 3.4.1 | ||
pheatmap | 1.0.12 | ||
PuTTY | |||
R | 3.4.0 | ||
RColorBrewer | 1.1-2 | ||
reshape2 | 1.4.3 | ||
rgl | 0.100.19 | ||
R-studio | |||
STAR | Version 2.6 or later | ||
sva | 3.24.4 | ||
TrimGalore! | |||
WinSCP |
Demande d’autorisation pour utiliser le texte ou les figures de cet article JoVE
Demande d’autorisationThis article has been published
Video Coming Soon