Un abonnement à JoVE est nécessaire pour voir ce contenu. Connectez-vous ou commencez votre essai gratuit.
Ici, nous introduisons un protocole de conversion des données transcriptomiques en une vue mqTrans, permettant l’identification de biomarqueurs sombres. Bien qu’ils ne soient pas exprimés de manière différentielle dans les analyses transcriptomiques conventionnelles, ces biomarqueurs présentent une expression différentielle dans la vue mqTrans. L’approche sert de technique complémentaire aux méthodes traditionnelles, dévoilant des biomarqueurs jusque-là négligés.
Le transcriptome représente les niveaux d’expression de nombreux gènes dans un échantillon et a été largement utilisé dans la recherche biologique et la pratique clinique. Les chercheurs se sont généralement concentrés sur les biomarqueurs transcriptomiques avec des représentations différentielles entre un groupe phénotypique et un groupe témoin d’échantillons. Cette étude a présenté un cadre d’apprentissage multitâche graph-attention network (GAT) pour apprendre les interactions intergéniques complexes des échantillons de référence. Un modèle de référence démonstratif a été pré-entraîné sur les échantillons sains (HealthModel), qui a pu être directement utilisé pour générer la vue de régulation transcriptionnelle quantitative basée sur le modèle (mqTrans) des transcriptomes de test indépendants. La vue mqTrans générée des transcriptomes a été démontrée par des tâches de prédiction et la détection de biomarqueurs sombres. Le terme inventé « biomarqueur sombre » découle de sa définition selon laquelle un biomarqueur sombre présentait une représentation différentielle dans la vue mqTrans mais pas d’expression différentielle dans son niveau d’expression d’origine. Un biomarqueur sombre a toujours été négligé dans les études traditionnelles de détection de biomarqueurs en raison de l’absence d’expression différentielle. Le code source et le manuel du pipeline HealthModelPipe peuvent être téléchargés à partir de http://www.healthinformaticslab.org/supp/resources.php.
Le transcriptome est constitué de l’expression de tous les gènes d’un échantillon et peut être profilé par des technologies à haut débit telles que les puces à ADN et le séquençage de l’ARN1. Les niveaux d’expression d’un gène dans un ensemble de données sont appelés une caractéristique transcriptomique, et la représentation différentielle d’une caractéristique transcriptomique entre le phénotype et le groupe témoin définit ce gène comme un biomarqueur de ce phénotype 2,3. Les biomarqueurs transcriptomiques ont été largement utilisés dans les enquêtes sur le diagno....
REMARQUE : Le protocole suivant décrit les détails de la procédure d’analyse informatique et des commandes Python des principaux modules. La figure 2 illustre les trois étapes principales avec des exemples de commandes utilisées dans ce protocole et se réfère aux travaux précédemment publiés26,38 pour plus de détails techniques. Effectuez le protocole suivant sous un compte d’utilisateur normal dans un système informatique et évitez d’utiliser le compte administrateur ou root. Il s’agit d’un protocole informatique qui ne comporte aucun facteur de danger biomédical.
Évaluation de la vue mqTrans de l’ensemble de données transcriptomiques
Le code de test utilise onze algorithmes de sélection de caractéristiques (FS) et sept classificateurs pour évaluer comment la vue mqTrans générée de l’ensemble de données transcriptomiques contribue à la tâche de classification (Figure 6). L’ensemble de données de test se compose de 317 adénocarcinomes du côlon (COAD) provenant de la base de données29 de l.......
La section 2 (Utiliser le HealthModel pré-entraîné pour générer les fonctionnalités mqTrans) du protocole est l’étape la plus critique de ce protocole. Après avoir préparé l’environnement de travail de calcul de la section 1, la section 2 génère la vue mqTrans d’un jeu de données transcriptomiques basé sur le modèle de référence de grande taille pré-entraîné. La section 3 est un exemple démonstratif de sélection des caractéristiques mqTrans générées pour les tâches de détection et de pr?.......
Les auteurs n’ont rien à divulguer.
Ce travail a été soutenu par l’équipe d’innovation technologique senior et junior (20210509055RQ), les projets scientifiques et technologiques de la province du Guizhou (ZK2023-297), la Fondation pour la science et la technologie de la Commission de la santé de la province du Guizhou (gzwkj2023-565), le projet scientifique et technologique du Département de l’éducation de la province du Jilin (JJKH20220245KJ et JJKH20220226SK), la Fondation nationale des sciences naturelles de Chine (U19A2061), le Laboratoire clé de la province du Jilin pour l’informatique intelligente des mégadonnées (20180622002JC) et le Fonds de recherche fondamentale pour les universités centrales....
Name | Company | Catalog Number | Comments |
Anaconda | Anaconda | version 2020.11 | Python programming platform |
Computer | N/A | N/A | Any general-purpose computers satisfy the requirement |
GPU card | N/A | N/A | Any general-purpose GPU cards with the CUDA computing library |
pytorch | Pytorch | version 1.13.1 | Software |
torch-geometric | Pytorch | version 2.2.0 | Software |
Demande d’autorisation pour utiliser le texte ou les figures de cet article JoVE
Demande d’autorisationExplorer plus d’articles
This article has been published
Video Coming Soon