Pour commencer, créez un environnement virtuel nommé Modèle d’intégrité avec Python version 3.7. Dans la plate-forme de calcul intensif du cluster Slurm, exécutez le module Load Anaconda Command. Une fois la commande exécutée, une invite de confirmation apparaît à l’écran.
Entrez Y pour continuer, puis attendez la fin du processus. Activez ensuite l’environnement virtuel en suivant les instructions spécifiques à la plate-forme. Ensuite, exécutez la commande pour installer PyTorch 1.13.1.
Installez des packages supplémentaires pour torch geometric, tels que torch_scatter, torch_sparse, torch_cluster et torch_spline_convulsion, en suivant les instructions d’installation. Installez ensuite la version 2.2.0 du package géométrique torch. Téléchargez le code et le modèle de santé pré-entraîné à partir du site Web du Laboratoire d’informatique de la santé.
Décompressez le fichier vers le chemin souhaité. Remplacez ensuite le répertoire de travail de la ligne de commande par le dossier mqTrans du modèle d’intégrité. Exécutez la commande pour générer des entités mqTrans et obtenir les sorties.
Les entités mqTrans seront générées en tant que fichier CSV de cibles MQ en sortie, et le fichier d’étiquettes sera réenregistré en tant que fichier CSV d’étiquette de sortie. De plus, les valeurs d’expression originales des gènes de l’ARNm seront extraites sous forme de CSV de cibles de test de sortie de fichier. Ensuite, utilisez l’algorithme de sélection d’entités pour sélectionner les entités mqTrans.
Si vous sélectionnez des fonctions mqTrans ou des fonctions d’origine sans les combiner, définissez l’option Combiner sur false. Sélectionnez 800 entités d’origine et divisez le jeu de données en 0,8 à 0,2 pour l’entraînement et les tests. Pour combiner des entités mqTrans avec les valeurs d’expression d’origine pour la sélection d’entités, définissez combiner sur true.
Des biomarqueurs sombres avec des valeurs différentielles de mqTrans, mais une expression non différentielle de l’ARNm, ont été identifiés. Parmi 3062 caractéristiques, 221 biomarqueurs sombres ont été détectés. La rareté générale des biomarqueurs sombres a été observée par rapport aux biomarqueurs traditionnels pour la plupart des types de cancer, à l’exception des gènes BRCA, MESO et TGCT.