Les échantillons utilisés dans ce protocole ont été approuvés par les comités d’éthique du Département de microbiologie de l’Institut des sciences biomédicales de l’Université de São Paulo et de l’Université fédérale de Sergipe (Protocoles: 54937216.5.0000.5467 et 54835916.2.0000.5546, respectivement).
1. Installation du bureau Docker
REMARQUE : Les étapes de préparation de l’environnement Docker sont différentes selon les systèmes d’exploitation. Par conséquent, les utilisateurs de Mac doivent suivre les étapes répertoriées comme 1.1, les utilisateurs Linux doivent suivre les étapes répertoriées comme 1.2 et les utilisateurs Windows doivent suivre les étapes répertoriées comme 1.3.
- Installer sur MacOS.
- Accédez au site Web Get Docker (Table of Materials), cliquez sur Docker Desktop pour Mac , puis cliquez sur le lien Télécharger à partir de Docker Hub .
- Téléchargez le fichier d’installation en cliquant sur le bouton Obtenir Docker .
- Exécutez le fichier Docker.dmg pour ouvrir le programme d’installation, puis faites glisser l’icône vers le dossier Applications . Localisez et exécutez le Docker.app dans le dossier Applications pour démarrer le programme.
REMARQUE: Le menu spécifique au logiciel dans la barre d’état supérieure indique que le logiciel est en cours d’exécution et qu’il est accessible à partir d’un terminal.
- Installez le programme conteneur sur le système d’exploitation Linux.
- Accédez au site Web Get Docker Linux (Table of Materials) et suivez les instructions d’installation à l’aide de la section du référentiel disponible sur le lien Docker Linux Repository .
- Mettez à jour tous les packages Linux à l’aide de la ligne de commande :
sudo apt-get mise à jour
- Installez les packages requis dans Docker :
sudo apt-get installer apt-transport-https ca-certificates curl gnupg lsb-release
- Créez un fichier de trousseau de clés d’archive logicielle :
curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo gpg --dearmor -o /usr/share/keyrings/docker-archive-keyring.gpg
- Ajoutez des informations Docker deb dans le fichier source.list :
echo « deb [arch=amd64 signed-by=/usr/share/keyrings/docker-archive-keyring.gpg] https://download.docker.com/linux/ubuntu $(lsb_release -cs) stable » | sudo tee /etc/apt/sources.list.d/docker.list > /dev/null
- Mettez à jour à nouveau tous les packages, y compris ceux récemment ajoutés :
sudo apt-get mise à jour
- Installez la version de bureau :
sudo apt-get installer docker-ce docker-ce-cli containerd.io
- Sélectionnez la zone géographique et le fuseau horaire pour terminer le processus d’installation.
- Installez le programme conteneur sur le système d’exploitation Windows.
- Accédez au site Web Get Docker (Table of Materials) et cliquez sur Get Started. Recherchez le programme d’installation de Docker Desktop pour Windows. Téléchargez les fichiers et installez-les localement sur l’ordinateur.
- Après le téléchargement, démarrez le fichier d’installation (.exe) et conservez les paramètres par défaut. Assurez-vous que les deux options Installer les composants Windows requis pour WSL 2 et Ajouter un raccourci au Bureau sont marquées.
REMARQUE: Dans certains cas, lorsque ce logiciel tente de démarrer le service, il affiche une erreur: l’installation de WSL est incomplète. Pour comprendre cette erreur, accédez au site Web WSL2-Kernel (Table of Materials).
- Téléchargez et installez le dernier noyau Linux WSL2.
- Accédez au terminal PowerShell en tant qu’administrateur et exécutez la commande :
dism.exe /online /enable-feature /featurename:Microsoft-Windows-Subsystem-Linux /all /norestart
- Assurez-vous que le logiciel Docker Desktop est installé avec succès.
- Téléchargez l’image à partir du référentiel CSBL sur le hub Docker (Table of Materials).
- Ouvrez le bureau Docker et vérifiez que l’état est « en cours d’exécution » en bas à gauche de la barre d’outils.
- Accédez à la ligne de commande du terminal Windows PowerShell. Téléchargez l’image du conteneur Linux pour ce protocole à partir du référentiel CSBL sur le hub Docker. Exécutez la commande suivante pour télécharger l’image :
docker pull csblusp/transcriptome
REMARQUE: Après avoir téléchargé l’image, le fichier peut être vu dans le bureau Docker. Pour créer le conteneur, les utilisateurs Windows doivent suivre l’étape 1.5, tandis que les utilisateurs Linux doivent suivre l’étape 1.6.
- Initialisez le conteneur de serveur sur le système d’exploitation Windows.
- Affichez le fichier image Docker dans le gestionnaire d’applications de bureau à partir de la barre d’outils et accédez à la page Images.
REMARQUE: Si l’image du pipeline a été téléchargée avec succès, une image csblusp/transcriptome sera disponible.
- Lancez le conteneur à partir de l’image csblusp/transcriptome en cliquant sur le bouton Exécuter . Développez les paramètres facultatifs pour configurer le conteneur.
- Définissez le nom du conteneur (par exemple, serveur).
- Associez un dossier de l’ordinateur local au dossier à l’intérieur du docker. Pour ce faire, déterminez le chemin d’accès de l’hôte. Définissez un dossier sur l’ordinateur local pour stocker les données traitées qui seront téléchargées à la fin. Définissez le chemin du conteneur. Définissez et liez le dossier conteneur csblusp/transcriptome au chemin d’accès de la machine locale (utilisez le nom « /opt/transferdata » pour le chemin du conteneur).
- Après cela, cliquez sur Exécuter pour créer le conteneur csblusp/transcriptome.
- Pour accéder au terminal Linux depuis le conteneur csblusp/transcriptome, cliquez sur le bouton CLI.
- Tapez dans le terminal bash pour avoir une meilleure expérience. Pour cela, exécutez la commande :
cogner
- Après avoir exécuté la commande bash, assurez-vous que le terminal affiche (root@:/#) :
root@ac12c583b731:/ #
- Initialisez le conteneur de serveur pour le système d’exploitation Linux.
- Exécutez cette commande pour créer le conteneur Docker basé sur l’image :
docker run -d -it --rm --name server -v :/opt/transferdata csblusp/transcriptome
Remarque : < chemin d’hôte> : définissez un chemin d’accès de l’ordinateur de dossier local.
- Exécutez cette commande pour accéder au terminal de commande du conteneur Docker :
docker exec -it serveur bash
- Assurez la disponibilité d’un terminal Linux pour exécuter tous les programmes/scripts à l’aide de la ligne de commande.
- Après avoir exécuté la commande bash, assurez-vous que le terminal affiche (root@:/#) :
root@ac12c583b731:/ #
REMARQUE : Le mot de passe root est « transcriptome » par défaut. Si vous le souhaitez, le mot de passe root peut être modifié en exécutant la commande :
passwd
- Tout d’abord, exécutez la commande source pour addpath.sh pour vous assurer que tous les outils sont disponibles. Exécutez la commande :
source /opt/addpath.sh
- Vérifiez la structure du dossier de séquençage de l’ARN.
- Accédez au dossier des scripts de pipeline de transcriptome et assurez-vous que toutes les données du séquençage de l’ARN sont stockées dans le dossier : /home/transcriptome-pipeline/data.
- Assurez-vous que tous les résultats obtenus à partir de l’analyse sont stockés dans le dossier du chemin /home/transcriptome-pipeline/results.
- Assurez-vous que les fichiers de référence du génome et des annotations sont stockés dans le dossier du chemin /home/transcriptome-pipeline/datasets. Ces fichiers aideront à prendre en charge toutes les analyses.
- Assurez-vous que tous les scripts sont stockés dans le dossier du chemin /home/transcriptome-pipeline/scripts et séparés par chaque étape comme décrit ci-dessous.
- Téléchargez l’annotation et le génome humain.
- Accédez au dossier scripts :
cd /home/transcriptome-pipeline/scripts
- Exécutez cette commande pour télécharger le génome humain de référence :
bash downloadGenome.sh
- Pour télécharger l’annotation, exécutez la commande :
bash downloadAnnotation.sh
- Modifiez l’annotation ou la version du génome de référence.
- Ouvrez downloadAnnotation.sh et downloadGenome.sh pour modifier l’URL de chaque fichier.
- Copiez les fichiers downloadAnnotation.sh et downloadGenome.sh dans la zone de transfert et modifiez-les dans le système d’exploitation local.
cd /home/transcriptome-pipeline/scripts
cp downloadAnnotation.sh downloadGenome.sh /opt/transferdata
- Ouvrez le dossier Chemin d’accès à l’hôte , qui est sélectionné pour lier entre l’hôte et le conteneur Docker à l’étape 1.5.4.
- Modifiez les fichiers à l’aide du logiciel d’édition préféré et enregistrez-les. Enfin, placez les fichiers modifiés dans le dossier de script. Exécutez la commande :
cd /opt/transferdata
cp downloadAnnotation.sh downloadGenome.sh /home/transcriptome-pipeline/scripts
REMARQUE: Ces fichiers peuvent être modifiés directement à l’aide de l’éditeur vim ou nano Linux.
- Ensuite, configurez l’outil fastq-dump avec la ligne de commande :
vdb-config --interactive
REMARQUE: Cela permet de télécharger des fichiers de séquençage à partir des données d’exemple.
- Naviguez dans la page Outils à l’aide de la touche de tabulation et sélectionnez l’option de dossier actif. Accédez à l’option Enregistrer et cliquez sur OK. Ensuite, quittez l’outil fastq-dump.
- Lancez le téléchargement des lectures à partir de l’article publié précédemment7. Le numéro d’acquisition SRA de chaque échantillon est requis. Procurez-vous les numéros SRA sur le site Web de SRA NCBI (Table of Materials).
REMARQUE: Pour analyser les données RNA-Seq disponibles sur les bases de données publiques, suivez l’étape 1.12. Pour analyser les données privées de séquençage d’ARN, suivez l’étape 1.13.
- Analyser des données publiques spécifiques.
- Accédez au site Web du National Center for Biotechnology Information (NCBI) et recherchez des mots-clés pour un sujet spécifique.
- Cliquez sur le lien Résultat pour BioProject dans la section Génomes .
- Choisissez et cliquez sur une étude spécifique. Cliquez sur les expériences SRA. Une nouvelle page s’ouvre, qui montre tous les échantillons disponibles pour cette étude.
- Cliquez sur le bouton « Envoyer à: » au-dessus du numéro d’acquisition. Dans l’option « Choisir la destination » , sélectionnez l’option Fichier et format , sélectionnez ExécuterInfo. Cliquez sur « Créer un fichier » pour exporter toutes les informations de la bibliothèque.
- Enregistrez le fichier SraRunInfo.csv dans le chemin d’accès hôte défini à l’étape 1.5.4 et exécutez le script de téléchargement :
cp /opt/transferdata/SraRunInfo.csv /home/transcriptome-pipeline/data
cd /home/transcriptome-pipeline/scripts
bash downloadAllLibraries.sh
- Analysez les données de séquençage privées et non publiées.
- Organisez les données de séquençage dans un dossier nommé Reads.
Remarque : Dans le dossier Lectures , créez un dossier pour chaque exemple. Ces dossiers doivent avoir le même nom pour chaque exemple. Ajoutez les données de chaque exemple dans son répertoire. Dans le cas où il s’agit d’un RNA-Seq à extrémité appariée, chaque répertoire d’échantillon doit contenir deux fichiers FASTQ, qui doivent présenter des noms se terminant selon les modèles {sample}_1.fastq.gz et {sample}_2.fastq.gz, séquences avant et arrière, respectivement. Par exemple, un exemple nommé « Healthy_control » doit avoir un répertoire portant le même nom et des fichiers FASTQ nommés Healthy_control_1.fastq.gz et Healthy_control_2.fastq.gz. Néanmoins, si le séquençage de la bibliothèque est une stratégie à extrémité unique, un seul fichier de lecture doit être enregistré pour une analyse en aval. Par exemple, le même exemple, « Contrôle sain », doit avoir un fichier FASTQ unique nommé Healthy_control.fastq.gz.
- Créez un fichier phénotypique contenant tous les noms d’échantillons : nommez la première colonne « Échantillon » et la deuxième colonne « Classe ». Remplissez la colonne Échantillon avec les noms des échantillons, qui doivent porter le même nom pour les répertoires d’échantillons, et remplissez la colonne Classe avec le groupe phénotypique de chaque échantillon (p. ex., témoin ou infecté). Enfin, enregistrez un fichier avec le nom « metadata.tsv » et envoyez-le dans le répertoire /home/transcriptome-pipeline/data/. Consultez le fichier metadata.tsv existant pour comprendre le format du fichier phénotypique.
cp /opt/transferdata/metadata.tsv
/home/transcriptome-pipeline/data/metadata.tsv
- Accédez au répertoire Chemin d’accès à l’hôte défini à l’étape 1.5.4 et copiez les nouveaux exemples de répertoires structurés. Enfin, déplacez les exemples de /opt/transferdata vers le répertoire de données du pipeline.
cp -rf /opt/transferdata/reads/*
/home/transcriptome-pipeline/data/reads/
- Observez que toutes les lectures sont stockées dans le dossier /home/transcriptome-pipeline/data/reads.
2. Contrôle de la qualité des données
REMARQUE : Évaluez, graphiquement, la probabilité d’erreurs dans les lectures de séquençage. Supprimez toutes les séquences techniques, par exemple les adaptateurs.
- Accédez à la qualité de séquençage des bibliothèques avec l’outil FastQC.
- Pour générer les graphiques de qualité, exécutez le programme fastqc. Exécutez la commande :
bash FastQC.sh
REMARQUE : Les résultats seront enregistrés dans le dossier /home/transcriptome-pipeline/results/FastQC. Étant donné que les adaptateurs de séquence sont utilisés pour la préparation et le séquençage de la bibliothèque, dans certains cas, les fragments de séquence d’adaptateurs peuvent interférer avec le processus de mappage.
- Retirez la séquence de l’adaptateur et les lectures de mauvaise qualité. Accédez au dossier Scripts et exécutez la commande de l’outil Trimmomatic :
cd /home/transcriptome-pipeline/scripts
bash trimmomatic.sh
REMARQUE: Les paramètres utilisés pour le filtre de séquençage sont les suivants: Supprimer le début de faible qualité ou 3 bases (en dessous de la qualité 3) (EN-TÊTE:3); Enlever la fin de mauvaise qualité ou 3 bases (en dessous de la qualité 3) (TRAILING:3); Scannez la lecture avec une fenêtre coulissante large à 4 bases, en coupant lorsque la qualité moyenne par base tombe en dessous de 20 (SLIDINGWINDOW:4:20); et Drop lit en dessous des 36 bases de long (MINLEN:36). Ces paramètres peuvent être modifiés en modifiant le fichier de script Trimmomatic.
- Assurez-vous que les résultats sont enregistrés dans le dossier suivant : /home/transcriptome-pipeline/results/trimreads. Exécutez la commande :
ls /home/transcriptome-pipeline/results/trimreads
3. Cartographie et annotation des échantillons
REMARQUE: Après avoir obtenu les lectures de bonne qualité, celles-ci doivent être mappées au génome de référence. Pour cette étape, le mappeur STAR a été utilisé pour mapper les exemples d’exemples. L’outil de cartographie STAR nécessite 32 Go de mémoire RAM pour charger et exécuter les lectures et la cartographie du génome. Pour les utilisateurs qui ne disposent pas de 32 Go de mémoire RAM, les lectures déjà mappées peuvent être utilisées. Dans de tels cas, passez à l’étape 3.3 ou utilisez le mappeur Bowtie2. Cette section contient des scripts pour STAR (résultats affichés dans toutes les figures) et Bowtie2 (mappeur à faible mémoire requise).
- Indexez d’abord le génome de référence pour le processus de cartographie :
- Accédez au dossier Scripts à l’aide de la ligne de commande :
cd /home/transcriptome-pipeline/scripts
- Pour le mappeur STAR, exécutez :
bash indexGenome.sh
- Pour Bowtie mapper, exécutez :
bash indexGenomeBowtie2.sh
- Exécutez la commande suivante pour mapper les lectures filtrées (obtenues à partir de l’étape 2) au génome de référence (version GRCh38). Les mappeurs STAR et Bowtie2 sont tous deux effectués à l’aide de paramètres par défaut.
- Pour le mappeur STAR, exécutez :
bash mapSTAR.sh
- Pour bowtie2 mapper, exécutez :
bash mapBowtie2.sh
REMARQUE : Les résultats finaux sont des fichiers BAM (Binary Alignment Map) pour chaque échantillon stocké dans /home/transcriptome-pipeline/results/mapreads.
- Annotez les lectures mappées à l’aide de l’outil FeatureCounts pour obtenir des comptes bruts pour chaque gène. Exécutez les scripts qui annotent les lectures.
REMARQUE : L’outil FeatureCounts est chargé d’attribuer des lectures de séquençage mappées aux entités génomiques. Les aspects les plus importants de l’annotation du génome qui peuvent être modifiés à la suite de la question biologique comprennent, la détection d’isoformes, de multiples lectures cartographiées et de jonctions exon-exon, correspondant aux paramètres, GTF.attrType="gene_name » pour le gène ou ne spécifiez pas les paramètres pour le niveau de méta-caractéristique, allowMultiOverlap = TRUE et juncCounts = TRUE, respectivement.
- Accédez au dossier scripts à l’aide de la ligne de commande :
cd /home/transcriptome-pipeline/scripts
- Pour annoter les lectures mappées afin d’obtenir des nombres bruts par gène, exécutez la ligne de commande :
Annotation Rscript. R
REMARQUE: Les paramètres utilisés pour le processus d’annotation étaient les suivants: nom abrégé du gène de retour (GTF.attrType="gene_name »); autoriser plusieurs chevauchements (allowMultiOverlap = TRUE); et indiquez que la bibliothèque est paired-end (isPairedEnd=TRUE). Pour la stratégie à extrémité unique, utilisez le paramètre isPairedEnd=FALSE. Les résultats seront enregistrés dans le dossier /home/transcriptome-pipeline/countreads.
- Normaliser l’expression des gènes.
REMARQUE : La normalisation de l’expression des gènes est essentielle pour comparer les résultats entre les résultats (p. ex., échantillons sains et échantillons infectés). La normalisation est également nécessaire pour effectuer les analyses de co-expression et de degré moléculaire de perturbation.
- Accédez au dossier Scripts à l’aide de la ligne de commande :
cd /home/transcriptome-pipeline/scripts
- Normaliser l’expression des gènes. Pour cela, exécutez la ligne de commande :
Rscript normalise les échantillons. R
REMARQUE : L’expression des nombres bruts, dans cette expérience, a été normalisée à l’aide des méthodes Trimmed Average of M-values (TMM) et Count Per Million (CPM). Cette étape vise à éliminer les différences dans l’expression des gènes dues à l’influence technique, en effectuant une normalisation de la taille de la bibliothèque. Les résultats seront enregistrés dans le dossier /home/transcriptome-pipeline/countreads.
4. Gènes exprimés différentiellement et gènes co-exprimés
- Identifiez les gènes exprimés différemment à l’aide du package EdgeR open-source. Cela implique de trouver des gènes dont l’expression est supérieure ou inférieure à celle du témoin.
- Accédez au dossier Scripts à l’aide de la ligne de commande :
cd /home/transcriptome-pipeline/scripts
- Pour identifier le gène exprimé différentiellement, exécutez le script R DEG_edgeR à l’aide de la ligne de commande :
Rscript DEG_edgeR.R
REMARQUE: Les résultats contenant les gènes exprimés différentiellement seront enregistrés dans le dossier /home/transcriptome-pipeline/results/degs. Les données peuvent être transférées vers un ordinateur personnel.
- Téléchargez les données à partir du conteneur csblusp/transcriptome.
- Transférez les données traitées du pipeline /home/transcriptome vers le dossier /opt/transferdata (ordinateur local).
- Copiez tous les fichiers sur l’ordinateur local en exécutant la ligne de commande :
cp -rf /home/transcriptome-pipeline/results /opt/transferdata/pipeline
cp -rf /home/transcriptome-pipeline/data /opt/transferdata/pipeline
Remarque : Maintenant, accédez à l’ordinateur local pour vous assurer que tous les résultats, jeux de données et données sont disponibles au téléchargement dans le chemin d’accès de l’hôte.
- Identifier les modules de co-expression.
- Accédez au site Web de l’outil d’identification des modules de co-expression (CEMiTool) (Tableau des
Matériaux). Cet outil identifie les modules de co-expression à partir des jeux de données d’expression fournis par les utilisateurs. Sur la page principale, cliquez sur Exécuter en haut à droite. Cela ouvrira une nouvelle page pour télécharger le fichier d’expression.
- Cliquez sur Choisir un fichier sous la section Fichier d’expression et téléchargez la matrice d’expression génique normalisée 'tmm_expression.tsv' à partir du chemin d’accès de l’hôte.
REMARQUE: Étape 4.4. n’est pas obligatoire.
- Explorez la signification biologique des modules de co-expression.
- Cliquez sur Choisir un fichier dans la section Exemples de phénotypes et téléchargez le fichier contenant des exemples de phénotypes metadata_cemitool.tsv à partir de l’étape Télécharger les données 4.2.2. pour effectuer une analyse d’enrichissement de l’ensemble de gènes (GSEA).
- Appuyez sur Choisir un fichier dans la section Interactions géniques pour télécharger un fichier contenant des interactions géniques (cemitool-interactions.tsv). Il est possible d’utiliser le fichier d’interactions géniques fourni à titre d’exemple par webCEMiTool. Les interactions peuvent être des interactions protéine-protéine, des facteurs de transcription et leurs gènes transcrits, ou des voies métaboliques. Cette étape produit un réseau d’interaction pour chaque module de co-expression.
- Cliquez sur choisir un fichier dans la section Ensembles de gènes pour télécharger une liste de gènes fonctionnellement liés dans un fichier au format GMT (Gene Matrix Transposed). Le fichier Gene Set permet à l’outil d’effectuer une analyse d’enrichissement pour chaque module de co-expression, c’est-à-dire une analyse de surreprésentation (ORA).
REMARQUE: Cette liste de gènes peut englober des voies, des termes GO ou des gènes cibles de miARN. Le chercheur peut utiliser les modules de transcription sanguine (BTM) comme ensembles de gènes pour cette analyse. Le fichier BTM (BTM_for_GSEA.gmt).
- Définissez des paramètres pour effectuer des analyses de co-expression et obtenez ses résultats.
- Ensuite, développez la section Paramètre , en cliquant sur le signe plus pour afficher les paramètres par défaut. Si nécessaire, changez-les. Cochez la case Appliquer VST .
- Écrivez l’e-mail dans la section E-mail pour recevoir les résultats sous forme d’e-mail. Cette étape est facultative.
- Appuyez sur le bouton Exécuter CEMiTool .
- Téléchargez le rapport d’analyse complet en cliquant sur Télécharger le rapport complet en haut à droite. Il téléchargera un fichier compressé cemitool_results.zip.
- Extrayez le contenu du cemitool_results.zip avec WinRAR.
REMARQUE: Le dossier avec le contenu extrait comprend plusieurs fichiers avec tous les résultats de l’analyse et leurs paramètres établis.
5. Détermination du degré moléculaire de perturbation des échantillons
- Degré moléculaire de perturbation (MDP) version web.
- Pour exécuter MDP, accédez au site Web MDP (Table of Materials). MDP calcule la distance moléculaire de chaque échantillon à partir de la référence. Cliquez sur le bouton Exécuter .
- Sur le lien Choisir un fichier , téléchargez le fichier d’expression tmm_expression.tsv. Ensuite, téléchargez le fichier de données phénotypiques metadata.tsv à partir de l’étape Télécharger les données 4.2.2. Il est également possible de soumettre un fichier d’annotation de voie au format GMT pour calculer le score de perturbation des voies associées à la maladie.
- Une fois les données téléchargées, définissez la colonne Classe qui contient les informations phénotypiques utilisées par le MDP. Ensuite, définissez la classe de contrôle en sélectionnant l’étiquette qui correspond à la classe de contrôle.
REMARQUE: Certains paramètres facultatifs affectent la façon dont les scores de l’échantillon sont calculés. Si nécessaire, l’utilisateur est en mesure de modifier la méthode moyenne des statistiques, l’écart-type et le pourcentage supérieur des gènes perturbés.
- Après cela, appuyez sur le bouton Exécuter MDP et les résultats MDP seront affichés. L’utilisateur peut télécharger les chiffres en cliquant sur le graphique de téléchargement dans chaque graphique, ainsi que sur le score MDP sur le bouton Télécharger le fichier de score MDP .
REMARQUE: En cas de questions sur la façon de soumettre les fichiers ou sur le fonctionnement de MDP, il suffit de parcourir les pages Web Didacticiel et À propos.
6. Analyse de l’enrichissement fonctionnel
- Créer une liste de DEG à régulation descendante et une autre de DEG à régulation ascendante. Les noms des gènes doivent être conformes aux symboles des gènes d’Entrez. Chaque gène de la liste doit être placé sur une ligne.
- Enregistrez les listes de gènes au format txt ou tsv.
- Accédez au site Web d’Enrichr (Table of Materials) pour effectuer l’analyse fonctionnelle.
- Sélectionnez la liste des gènes en cliquant sur choisir un fichier. Sélectionnez l’un des DEG et appuyez sur le bouton Soumettre .
- Cliquez sur Pathways en haut de la page Web pour effectuer une analyse d’enrichissement fonctionnel avec l’approche ORA.
- Choisissez une base de données de chemins. La base de données des voies « Reactome 2016 » est largement utilisée pour obtenir la signification biologique des données humaines.
- Cliquez à nouveau sur le nom de la base de données des chemins. Sélectionnez Graphique à barres et vérifiez s’il est trié par classement de valeur p. Sinon, cliquez sur le graphique à barres jusqu’à ce qu’il soit trié par valeur de p. Ce graphique à barres comprend les 10 principales voies en fonction des valeurs de p.
- Appuyez sur le bouton Configuration et sélectionnez la couleur rouge pour l’analyse des gènes régulés vers le haut ou la couleur bleue pour l’analyse des gènes régulés vers le bas. Enregistrez le graphique à barres dans plusieurs formats en cliquant sur svg, png et jpg.
- Sélectionnez Table et cliquez sur Exporter les entrées vers la table en bas à gauche du graphique à barres pour obtenir les résultats de l’analyse d’enrichissement fonctionnel dans un fichier txt.
REMARQUE: Ce fichier de résultats d’enrichissement fonctionnel comprend dans chaque ligne le nom d’une voie, le nombre de gènes superposés entre la liste DEG soumise et la voie, la valeur p, la valeur p ajustée, le rapport de cotes, le score combiné et le symbole génétique des gènes présents dans la liste DEG qui participent à la voie.
- Répétez les mêmes étapes avec la liste des autres DEG.
REMARQUE: L’analyse avec des DEG régulés à la baisse fournit des voies enrichies pour les gènes régulés à la baisse et l’analyse avec des gènes régulés à la hausse fournit des voies enrichies pour les gènes régulés à la hausse.