Cette mesure peut aider à répondre à des questions clés dans le domaine de la détection biomédicale sur la génération de solutions multiples. Le principal avantage de cette technique est qu’elle fournit une interface utilisateur graphique conviviale pour aider les chercheurs biomédicaux dans la détection de multiples disparaissent. Commencez par charger la matrice de données et les étiquettes de classe dans le logiciel.
Cliquez sur la matrice de données de charge pour sélectionner les étiquettes de fichier de métriques de données spécifiées par l’utilisateur et charger les étiquettes de classe pour sélectionner le fichier d’étiquette de classe correspondant. Pour déterminer les étiquettes de classe dans le nombre de fonctionnalités les mieux classées, sélectionnez les noms des classes positives et négatives dans les boîtes de drop down appropriées et sélectionnez 10 comme nombre de fonctionnalités les mieux classées dans la boîte de drop down top X pour un écran complet du sous-ensemble de fonctionnalités. Pour régler les paramètres du système pour différentes performances, sélectionnez la précision de mesure des performances comme la précision équilibrée drop down box pour le classificateur de machine d’apprentissage extrême sélectionné.
Ensuite, sélectionnez une valeur limite de 0,7 pour la mesure de performance spécifiée dans la boîte d’entrée de coupure de performance. Pour exécuter le pipeline, cliquez sur analyser et sélectionnez 0,7 comme valeur par défaut de la mesure des performances coupée. Et, 10 comme le nombre par défaut des meilleurs sous-ensembles de fonctionnalités.
Puis recueillir et interpréter les fonctionnalités détectées par le logiciel. Pour générer un diagramme de dispersion 3D des 10 principales fonctionnalités des sous-ensembles avec les meilleures performances de classification détectées par le logiciel, cliquez sur analyser et trier les trois fonctionnalités d’un sous-ensemble de fonctionnalités dans l’ordre croissant de leurs rangs, en utilisant les rangs des trois fonctionnalités comme les axes F1, F2 et F3. Modifiez la valeur de coupure de performance à 0,7 et cliquez sur analyser pour générer une parcelle de diffusion 3D des sous-ensembles de fonctionnalités avec une valeur de mesure des performances supérieure ou égale à celle de la réduction des performances.
Cliquez ensuite sur le réglage 3D pour ouvrir une nouvelle fenêtre pour l’accordage manuel des angles de vision de la parcelle de diffusion 3D et réduire pour réduire la redondance des sous-ensembles de fonctionnalités détectés. Pour annoter un gène dans les niveaux de séquence d’ADN et de protéines, ouvrez la page Web de la base de données David et cliquez sur le lien de conversion de l’ID génétique pour saisir les identifiants des fonctionnalités du premier sous-ensemble de biomarqueurs de l’ensemble de données préparé. Cliquez sur le lien de liste génétique et cliquez sur soumettre la liste pour récupérer les annotations d’intérêt, et afficher la liste des gènes pour obtenir la liste des symboles génétiques.
Ensuite, ouvrez la page Web de la base de données GeneCards et entrez le nom du gène d’intérêt dans la boîte d’entrée de requête de base de données pour trouver les annotations de ce gène. Ouvrez la base de données en ligne Héritage médélien chez l’homme et recherchez le gène pour trouver les annotations de ce gène à partir de la base de données. Pour annoter les protéines codées, ouvrez la page de base de données de base de connaissances UniProt et recherchez les annotations du gène à partir de cette base de données.
Ouvrez le système de prédiction basé sur le groupe, ou serveur Web GPS, et récupérez la séquence protéique codée par le gène biomarqueur de la base de données de base de connaissances UniProt et utilisez l’outil GPS en ligne pour prédire les résidus de modification post-transition des protéines. Pour annoter les interactions protéines-protéines et y enrichir les modules fonctionnels, ouvrez la page du serveur Web de chaîne et utilisez la base de données des cordes pour rechercher dans l’ascenseur les gènes d’intérêt pour trouver leurs propriétés orchestrées. Pour exporter les sous-ensembles de biomarqueurs détectés pour une analyse plus approfondie, cliquez sur exporter la table et sélectionnez le format de texte approprié pour enregistrer les fichiers.
Ensuite, exportez les parcelles de visualisation sous forme de fichiers d’images individuels, en cliquant sur enregistrer sous chaque parcelle et en sélectionnant le format d’image approprié pour enregistrer chaque fichier. Dans cette expérience représentative, deux ensembles de données ont été formatés sous forme de fichiers CSV et chargés dans le logiciel comme démontré. Dans le premier ensemble de données, 128 échantillons contenant 12 625 caractéristiques et étiquettes individuelles ont été chargés avec la matrice de données finales contenant 95 échantillons négatifs et 33 échantillons positifs.
Des opérations similaires ont également été menées pour le deuxième ensemble de données difficiles. La recherche d’un mot clé spécifique à l’utilisateur dans les noms de fonctionnalités révèle un histogramme des fonctionnalités pour chaque ensemble de données. Après l’exécution de l’algorithme de pipeline pour chaque ensemble de données, 120 sous-ensembles de biomarqueurs qualifiés ont été détectés pour l’ensemble de données facile à discriminer, avec 57 sous-ensembles de biomarqueurs triplet démontrant une précision de 100 %.
Seulement 76 sous-ensembles de biomarqueurs lorsqu’ils sont détectés pour l’ensemble de données difficiles, cependant. Et, avec une précision inférieure de sous-ensemble de biomarqueurs suggérant que les biomarqueurs sont spécifiques au phénotype, un autre défi majeur dans la détection des biomarqueurs. Lors de l’utilisation de cette procédure, il est important de se rappeler qu’un problème de sélection futur a plusieurs solutions.
Lisez le meilleur sim de la performance. Après son développement, cette technique a ouvert la voie aux chercheurs biomédicaux pour explorer la détection biomédicale avec de multiples solutions.