Génération de la vue de régulation transcriptionnelle des caractéristiques transcriptomiques pour la tâche de prédiction et la détection de biomarqueurs sombres sur de petits ensembles de données

Kewei Li; Yusi Fan; Yaqing Liu; Hongmei Liu; Gongyou Zhang; Meiyu Duan; Lan Huang; Fengfeng Zhou

doi:10.3791/66030

Auteurs

Contactez-nous

S'identifier

Un abonnement à JoVE est nécessaire pour voir ce contenu. Connectez-vous ou commencez votre essai gratuit.

Génération de la vue de régulation transcriptionnelle des caractéristiques transcriptomiques pour la tâche de prédiction et la détection de biomarqueurs sombres sur de petits ensembles de données

DOI:

10.3791/66030

⸱

March 1st, 2024

Kewei Li¹, Yusi Fan¹, Yaqing Liu¹, Hongmei Liu², Gongyou Zhang², Meiyu Duan¹, Lan Huang¹, Fengfeng Zhou¹

¹College of Computer Science and Technology, and Key Laboratory of Symbolic Computation and Knowledge Engineering of Ministry of Education, Jilin University, ²School of Biology and Engineering, Guizhou Medical University

Veuillez noter que toutes les traductions sont générées par l'IA. Cliquez ici pour la version Anglaise.

Résumé

Ici, nous introduisons un protocole de conversion des données transcriptomiques en une vue mqTrans, permettant l’identification de biomarqueurs sombres. Bien qu’ils ne soient pas exprimés de manière différentielle dans les analyses transcriptomiques conventionnelles, ces biomarqueurs présentent une expression différentielle dans la vue mqTrans. L’approche sert de technique complémentaire aux méthodes traditionnelles, dévoilant des biomarqueurs jusque-là négligés.

Résumé

Le transcriptome représente les niveaux d’expression de nombreux gènes dans un échantillon et a été largement utilisé dans la recherche biologique et la pratique clinique. Les chercheurs se sont généralement concentrés sur les biomarqueurs transcriptomiques avec des représentations différentielles entre un groupe phénotypique et un groupe témoin d’échantillons. Cette étude a présenté un cadre d’apprentissage multitâche graph-attention network (GAT) pour apprendre les interactions intergéniques complexes des échantillons de référence. Un modèle de référence démonstratif a été pré-entraîné sur les échantillons sains (HealthModel), qui a pu être directement utilisé pour générer la vue de régulation transcriptionnelle quantitative basée sur le modèle (mqTrans) des transcriptomes de test indépendants. La vue mqTrans générée des transcriptomes a été démontrée par des tâches de prédiction et la détection de biomarqueurs sombres. Le terme inventé « biomarqueur sombre » découle de sa définition selon laquelle un biomarqueur sombre présentait une représentation différentielle dans la vue mqTrans mais pas d’expression différentielle dans son niveau d’expression d’origine. Un biomarqueur sombre a toujours été négligé dans les études traditionnelles de détection de biomarqueurs en raison de l’absence d’expression différentielle. Le code source et le manuel du pipeline HealthModelPipe peuvent être téléchargés à partir de http://www.healthinformaticslab.org/supp/resources.php.

Introduction

Le transcriptome est constitué de l’expression de tous les gènes d’un échantillon et peut être profilé par des technologies à haut débit telles que les puces à ADN et le séquençage de l’ARN¹. Les niveaux d’expression d’un gène dans un ensemble de données sont appelés une caractéristique transcriptomique, et la représentation différentielle d’une caractéristique transcriptomique entre le phénotype et le groupe témoin définit ce gène comme un biomarqueur de ce phénotype ^2,3. Les biomarqueurs transcriptomiques ont été largement utilisés dans les enquêtes sur le diagno....

Protocole

REMARQUE : Le protocole suivant décrit les détails de la procédure d’analyse informatique et des commandes Python des principaux modules. La figure 2 illustre les trois étapes principales avec des exemples de commandes utilisées dans ce protocole et se réfère aux travaux précédemment publiés^26,38 pour plus de détails techniques. Effectuez le protocole suivant sous un compte d’utilisateur normal dans un système informatique et évitez d’utiliser le compte administrateur ou root. Il s’agit d’un protocole informatique qui ne comporte aucun facteur de danger biomédical.

Résultats Représentatifs

Évaluation de la vue mqTrans de l’ensemble de données transcriptomiques
Le code de test utilise onze algorithmes de sélection de caractéristiques (FS) et sept classificateurs pour évaluer comment la vue mqTrans générée de l’ensemble de données transcriptomiques contribue à la tâche de classification (Figure 6). L’ensemble de données de test se compose de 317 adénocarcinomes du côlon (COAD) provenant de la base de données²⁹ de l.......

Discussion

La section 2 (Utiliser le HealthModel pré-entraîné pour générer les fonctionnalités mqTrans) du protocole est l’étape la plus critique de ce protocole. Après avoir préparé l’environnement de travail de calcul de la section 1, la section 2 génère la vue mqTrans d’un jeu de données transcriptomiques basé sur le modèle de référence de grande taille pré-entraîné. La section 3 est un exemple démonstratif de sélection des caractéristiques mqTrans générées pour les tâches de détection et de pr?.......

Déclarations de divulgation

Les auteurs n’ont rien à divulguer.

Remerciements

Ce travail a été soutenu par l’équipe d’innovation technologique senior et junior (20210509055RQ), les projets scientifiques et technologiques de la province du Guizhou (ZK2023-297), la Fondation pour la science et la technologie de la Commission de la santé de la province du Guizhou (gzwkj2023-565), le projet scientifique et technologique du Département de l’éducation de la province du Jilin (JJKH20220245KJ et JJKH20220226SK), la Fondation nationale des sciences naturelles de Chine (U19A2061), le Laboratoire clé de la province du Jilin pour l’informatique intelligente des mégadonnées (20180622002JC) et le Fonds de recherche fondamentale pour les universités centrales....

matériels

Name	Company	Catalog Number	Comments
Anaconda	Anaconda	version 2020.11	Python programming platform
Computer	N/A	N/A	Any general-purpose computers satisfy the requirement
GPU card	N/A	N/A	Any general-purpose GPU cards with the CUDA computing library
pytorch	Pytorch	version 1.13.1	Software
torch-geometric	Pytorch	version 2.2.0	Software

Références

Mutz, K. -. O., Heilkenbrinker, A., Lönne, M., Walter, J. -. G., Stahl, F. Transcriptome analysis using next-generation sequencing. Curr Opin in Biotechnol. 24 (1), 22-30 (2013).
Meng, G., Tang, W., Huang, E., Li, Z., Feng, H.

Réimpressions et Autorisations

Demande d’autorisation pour utiliser le texte ou les figures de cet article JoVE

Demande d’autorisation

Explorer plus d’articles

Neurosciences Num ro 205

This article has been published

Video Coming Soon

Keep me updated: