DiCoExpress fournit une analyse aoristique complète du contrôle qualité à la co-expression. Il effectue une analyse différentielle basée sur les contrastes à l’intérieur du modèle linéaire généralisé. De plus, il peut également effectuer une analyse d’enrichissement sur la liste des gènes exprimés différentiellement et les groupes de gènes co-exprimés.
Le principal avantage de DiCoExpress est qu’il peut être utilisé par des gens comme moi, sans aucune connaissance particulière en statistiques ou en programmation aérienne. Il aide vraiment un utilisateur non spécialiste à écrire le contraste nécessaire à l’analyse différentielle de l’expression génique. Il fournit également des sorties graphiques illustrant les résultats prêts à être publiés.
DiCoExpress n’est pas un outil dédié au plan. Il peut être utilisé pour n’importe quel organisme tant que la conception expérimentale est complète avec jusqu’à deux facteurs biologiques. De plus, la conception d’une membrane avec un nombre inégal de réplications entre les conditions est également possible.
Un débutant doit avoir des connaissances préliminaires en R.Vous devez savoir utiliser une fonction et identifier les arguments requis et facultatifs. Ensuite, l’étape critique consiste à fournir correctement les fichiers contenant le et le plan expérimental. Pour commencer, ouvrez la session R studio.
Définissez le répertoire sur les scripts de modèle et ouvrez le script DiCoExpress tutorial dot R. Chargez les fonctions DiCoExpress dans la session R. Ensuite, chargez les fichiers de données dans la session R et divisez les fichiers de données d’objet en plusieurs objets pour manipuler facilement les fichiers.
Ensuite, sélectionnez une stratégie parmi les conditions NB ou les réplications NB et un seuil pour filtrer les gènes faiblement exprimés. Spécifiez les couleurs de groupe et sélectionnez une méthode de normalisation. Ensuite, effectuez le contrôle de la qualité.
Si les données sont appariées en fonction du facteur de réplication, l’état est répliqué comme true, sinon l’état est false. Attribuez la valeur true à l’interaction pour considérer une interaction entre les deux facteurs biologiques. Sinon, affectez false, puis spécifiez le modèle statistique et définissez le seuil du taux de fausse découverte.
Effectuer l’analyse différentielle suivie de la fixation d’un seuil pour l’analyse d’enrichissement et de l’analyse d’enrichissement des listes de gènes exprimés différentiellement. Sélectionnez les listes DEG à comparer. Attribuez un nom à la comparaison de listes et utilisez le même nom pour le répertoire dans lequel les fichiers de sortie seront enregistrés.
Définissez l’opération de paramètre sur union ou intersection pour spécifier l’action à effectuer sur les listes DEG et comparez les listes. Effectuer une analyse de co-expression suivie de l’analyse d’enrichissement des clusters de co-expression. Et enfin, générez deux fichiers journaux contenant toutes les informations nécessaires pour reproduire l’analyse.
Les comptes totaux normalisés par échantillon devraient être similaires lors de la comparaison entre les conditions intra et inter-conditions. Le nombre normalisé d’expression génique présentait une médiane et une variance similaires, tant dans les conditions intra qu’inter. Pour identifier les structures de données sous-jacentes potentielles, des diagrammes PCA ont été générés.
Une distinction claire a été observée entre les traitements et le regroupement était absent, ce qui indique un ensemble de données de bonne qualité. Les histogrammes de la valeur brute ont été tracés pour évaluer la qualité de la modélisation. La distribution des valeurs brutes était uniforme, avec un pic à l’extrémité gauche de la distribution, comme prévu.
L’absence de pic à l’extrémité droite indique que la modélisation statistique semble correcte. Le profil d’expression du gène CIG62301.1, dans chaque génotype et condition, a été tracé. Ainsi que le nombre de gènes exprimés différentiellement vers le haut et vers le bas, ont également été tracés pour chaque contraste testé.
L’analyse de co-expression a été réalisée sur l’union de cinq listes DEG. Identifié par contraste, la recherche d’une variation de réponse au traitement entre le génotype un ou deux et les autres. Les gènes co-exprimés pour chaque groupe identifié ont été imprimés dans des fichiers texte individuels et le profil d’expression des gènes a été tracé.
Avec DiCoExpress, les biologistes obtiendront une analyse de l’expression génique statistiquement valable. La prochaine étape consiste à donner un sens biologique à partir de ces résultats.