CorExplorer trouve des facteurs d’expression génétique associés à la tumeur d’une manière qui est mathématiquement fondée sur des principes à l’aide de visualisations interactives, ainsi que des informations cliniques et de base de données pour la découverte biologique. CorEx effectue la maximisation de l’information d’une manière qui nécessite relativement peu d’échantillons pour trouver des clusters dans des données de haute dimension. La hiérarchie des facteurs latents qu’elle produit facilite la compréhension biologique.
Cette méthode s’est déjà avérée intéressante lorsqu’elle est appliquée à la biologie du cancer. Ses fondements théoriques de l’information le rendent applicable à tout système avec de nombreuses variables et peu de connaissances préalables sur leurs relations. Commencez par naviguer vers la page d’accueil de CorExplorer.
Sous Quick Links, cliquez sur le bouton plus expand pour voir un résumé du graphique des facteurs CorEx qui a été formé sur les données d’intérêt sur le cancer. Par exemple, ici, les graphiques des facteurs pour les données tcga sur le cancer de l’ovaire sont affichés. Après avoir inspecté les graphiques des facteurs, cliquez sur le poumon TCGA-LUAD pour accéder à la page CorExplorer pour le séquençage de l’ARN du cancer du poumon et utilisez la fenêtre CorExplorer Factor Graph pour explorer le graphique des facteurs CorEx pour un gène d’intérêt.
Tout en déplaçant le curseur de la souris sur la fenêtre d’affichage graphique facteur, zoomer sur le graphique des facteurs en utilisant le trackpad de la souris pour afficher les détails du graphique, tels que les gènes les plus importants dans chaque facteur et les connexions entre les nœuds à différentes couches. Pour localiser un gène cible, cliquez sur le menu Gene et tapez le nom du gène pour le sélectionner dans la liste de drop-down. Appuyez sur Retour sur le clavier pour faire zoomer la vue sur le facteur avec lequel le gène d’intérêt est le plus fortement corrélé.
Repositionnez la souris sur l’écran graphique et faites défiler pour effectuer un zoom arrière pour voir le niveau du nœud et ses facteurs associés qui sont voisins du facteur génétique le plus étroitement associé. Notez que seuls les gènes dont le poids est supérieur au seuil indiqué sur le curseur min Link Weight sont affichés. Pour afficher tous les gènes associés au facteur, cliquez sur le nœud approprié et sélectionnez Charger des gènes supplémentaires dans la fenêtre contexturée.
Lorsque Done apparaît, fermez la fenêtre pop-up. Dans la section en-tête, cliquez et faites glisser le modificateur de poids min Link à 0,05 pour permettre aux gènes d’apparaître dans l’ordre de poids. Pour identifier les associations avec une fonction biologique, dans la fenêtre Annotation décochez le faux type de taux de découverte pour trier le menu de drop-down factor par numéro de facteur plutôt que par faux taux de découverte.
Faites défiler et cliquez pour sélectionner le facteur d’intérêt dans le menu de drop-down de la fenêtre d’annotation pour révéler les annotations d’enrichissement pour le facteur. Cliquez ensuite sur un facteur d’enrichissement pour afficher immédiatement les gènes associés comme mis en évidence en jaune sur l’écran graphique. Notez que les facteurs qui disparaissent ou apparaissent comme différents termes GO sont sélectionnés selon qu’ils sont enrichis ou non pour les gènes avec l’annotation sélectionnée.
Pour les facteurs de filtre d’intérêt, en utilisant la survie et la qualité des grappes, à partir du menu dataset drop-down sélectionnez TCGA_OVCA pour aller à la page CorExplorer pour le séquençage de l’ARN du cancer de l’ovaire TCGA. Notez à partir de la fenêtre Survie le facteur avec le différentiel de survie le plus important et sélectionnez ce facteur dans la fenêtre Factor Graph à partir du menu de drop-down factor. Cliquez et faites glisser le curseur link weight à 0,5 et notez le nombre de gènes dans le facteur.
Élargissez la liste des facteurs de la fenêtre Survie et cliquez sur le meilleur facteur suivant dans la fenêtre Survie pour voir ses courbes de survie associées. Les annotations significatives de GO et kegg seront affichées. Pour mieux comprendre le rôle biologique des gènes dans ce facteur, sélectionnez la couche factor en haut de la fenêtre Factor Graph et déplacez la souris par-dessus la fenêtre tout en zoomant pour révéler l’ensemble du cluster et les facteurs associés.
Pour comprendre l’importance relative des facteurs liés au nœud de cluster, décochez trier par p-val dans la fenêtre Survie et cliquez successivement sur chacun des nombres de facteurs pour les afficher, en notant les facteurs qui affichent une association de survie. Dans le menu Ajouter fenêtre sélectionnez PPI et cliquez sur Ajouter pour ajouter une fenêtre graphique PPI à la zone d’affichage. Dans la fenêtre graphique PPI sélectionnez une couche de facteur d’intérêt pour afficher les interactions protéine-protéine qui sont significatives.
Cliquez sur le lien Afficher sur StringDB pour vous connecter à la base de données en ligne STRINGdb et cliquez sur Continuer. Ouvrez ensuite l’onglet Anaylsis pour obtenir une analyse GO en ligne pour les gènes du réseau PPI. Le composant cellulaire supérieur sera affiché.
Retournez à l’onglet CorExplorer et à la fenêtre PPI et sélectionnez un autre facteur. Cliquez à nouveau sur le lien Afficher à StringDB. Un autre composant cellulaire supérieur sera affiché.
Ensuite, dans la fenêtre PPI, sélectionnez un autre facteur pour une analyse de base de données STRING. Pour trouver des points communs et des différences de variation de l’expression des gènes entre les types de tumeurs cliquez sur le titre CorExplorer pour revenir à la première page et cliquez sur Recherche pour accéder à une page permettant la recherche de tous les ensembles de données sur le site CorExplorer. Dans la case Recherche génétique, entrez un nom génétique d’intérêt et cliquez sur Recherche.
Par exemple, comme démontré FLT1 se trouve avec un poids relativement élevé et de multiples facteurs différents. La recherche du gène BRCA1 dans l’ensemble de données sur le cancer du poumon révèle que le gène est le plus fortement associé au facteur 26 de CorEx. L’enrichissement de terme go pour ce facteur est extrêmement élevé, avec la réparation d’ADN présentant un taux de fausse découverte de seulement une fois 10 au négatif 19.
La sélection attire également l’attention sur le groupe de deuxième niveau L2_8 qui a six facteurs étroitement liés en tant qu’enfants. Le réseau d’interaction protéine-protéine de réparation de l’ADN est fortement relié, soutenant davantage la fonctionnalité étroitement liée des gènes dans le facteur 26. Les graphiques de survie associés suggèrent une association possible avec la survie du patient qui devrait être confirmée dans un ensemble de données plus large.
En commençant par l’évaluation de survie peut permettre la dissection des facteurs qui sont corrélés avec une survie améliorée associée à des groupes d’expression génétique particuliers. L’ajout d’une fenêtre d’interaction protéine-protéine pour chaque facteur facilite à son tour la détermination des explications possibles de leurs associations avec la survie. Il est important de vérifier les cartes thermiques de chaque facteur pour confirmer que le modèle d’expression des gènes est d’une qualité adéquate pour soutenir les interprétations biologiques.
Les cartes thermiques qui montrent des variations fortes et claires des modèles d’expression des gènes peuvent présenter soit une expression coordonnée des gènes du facteur, allant de modèles élevés à faibles, soit des modèles plus complexes, certains gènes ayant une faible expression étant corrélée avec d’autres gènes à forte expression. L’objectif principal de cette procédure est de définir une thérapie personnalisée en cartographiant une tumeur hors échantillon sur les facteurs CorExplorer pour identifier les thérapies potentielles spécifiques à la tumeur.