Un abonnement à JoVE est nécessaire pour voir ce contenu. Connectez-vous ou commencez votre essai gratuit.
Method Article
Nous fournissons un protocole normalisé pour l’utilisation du gène enrichissement set analyse des données transcriptomiques pour identifier un modèle souris idéal pour la recherche translationnelle.
Ce protocole peut être utilisé avec les puces à ADN et des données de séquençage de l’ARN et encore peut être étendu à d’autres données omics si des données sont disponibles.
Récentes études comparant les ensembles de données transcriptomique des maladies humaines avec les ensembles de données de modèles de souris en utilisant des techniques traditionnelles de gènes comparaison a abouti à des conclusions contradictoires au sujet de la pertinence de modèles animaux pour translationnelle recherche. Des principales raisons des écarts entre les analyses d’expression de gène différent sont le filtrage arbitraire de gènes différentiellement exprimés. En outre, la comparaison d’un simple gène entre espèces différentes et souvent les plates-formes est limitée par la technique variance, conduisant à une interprétation erronée de la con/discordance entre les données provenant de modèles humains et animaux. Ainsi, les méthodes normalisées d’analyse des données systématiques sont nécessaires. Pour surmonter le gène subjective de filtrage et les comparaisons de gène à gène inefficaces, nous a récemment démontré que le gène enrichissement set analyse (GSEA) a le potentiel pour éviter ces problèmes. Par conséquent, nous avons développé un protocole normalisé pour l’utilisation de GSEA pour distinguer les modèles animaux appropriés et inappropriés pour la recherche translationnelle. Ce protocole ne convient pas à prédire comment concevoir de nouveaux systèmes de modèle a priori–, puisqu’elle requiert des données expérimentales omics existantes. Toutefois, le protocole décrit comment interpréter les données existantes d’une manière standardisée afin de sélectionner le modèle animal plus adapté, ainsi évitant les expérimentations animales inutiles et trompeuses études translationnelles.
Modèles animaux sont largement utilisés pour l’étude des maladies humaines, en raison de leur ressemblance supposée à l’homme sur le plan génétique, l’anatomie et la physiologie. En outre, des modèles animaux souvent servent portiers aux thérapies cliniques et peuvent avoir un impact énorme sur le succès de la recherche translationnelle. Une sélection rigoureuse du modèle animal optimale peut réduire le nombre d’études animales trompeuses. Récemment, la pertinence de modèles animaux pour la recherche translationnelle a été controversée, notamment parce que l’analysant les ensembles de données même obtenus à partir des maladies inflammatoires humaines et modèles murins connexes ont conduit à des conclusions contradictoires 1,2. Cette discussion a révélé un problème fondamental au cours de l’analyse des données omique : des approches normalisées pour l’analyse de données systématiques sont nécessaires afin de réduire la sélection de gènes partiale et d’augmenter la robustesse des comparaisons interspécifiques 3.
Traditionnellement, l’analyse des données transcriptomique (et autres données omics) se fait au niveau monogéniques et comprend une première étape de sélection génétique basée sur les paramètres de seuil strictes (par exemple, les changements de pli > 2.0, la valeur p < 0,05). Cependant, le réglage des paramètres de seuil initial souvent est subjectif, arbitraire et pas biologiquement justifiée et peut même conduire à des conclusions opposées1,2. En outre, sélection de gènes initial généralement restreint l’analyse aux quelques très en amont et réprimés gènes et n’est donc pas suffisamment sensible pour inclure la plupart des gènes qui sont exprimés dans une moindre mesure.
Avec la montée de l’ère de la génomique dans les années 2000 et la connaissance croissante des voies biologiques et des contextes, des approches statistiques ont été développés qui permettait de contourner les limites des analyses de niveau monogéniques. Gène set enrichissement analyse (GSEA)4, qui est l’une des méthodes largement acceptées pour l’analyse des données transcriptomique, fait appel à des groupes définis a priori des gènes (par exemple, signalisation, localisation proximale sur un chromosome etc..). GSEA mappe tout d’abord tous les gènes non filtrées détectés pour les ensembles de gènes prévue (p. ex., voies), quel que soit leur changement individuel dans l’expression. Ainsi, cette approche comprend aussi modérément réglementé de gènes qui seraient autrement perdus avec analyses de niveau monogéniques. Le changement d’additif dans l’expression à l’intérieur des ensembles de gènes s’effectue par la suite en utilisant les statistiques de somme en cours d’exécution.
Malgré sa large utilisation dans la recherche médicale, GSEA et approches connexes enrichissement set ne sont pas évidemment pris en compte pour l’analyse des données complexes omics. Nous décrivons ici un protocole pour comparer les omiques données provenant d’échantillons humains avec ceux des modèles de souris afin d’identifier le modèle idéal pour les études translationnelles. Nous démontrons l’applicabilité du protocole basé sur une collection de modèles de souris utilisées pour imiter les troubles inflammatoires humaines. Toutefois, ce pipeline d’analyse ne se limite pas à l’homme-souris comparaisons et recherche modifiable en plus d’autres questions.
1. téléchargement du logiciel GSEA et la base de données de Signatures moléculaires
2. Télécharger des données expérimentales d’Expression génique pour la maladie humaine et des modèles appropriés d’Animal
3. Données de manutention et de mise en forme
4. Effectuant la GSEA
5. En comparant les résultats GSEA
6. Identifier le modèle Optimal d’Animal
GSEA workflow et des captures d’écran de données exemplaires sont démontrés. La figure 1 montre le fichier de données d’expression de gène qui contient les données transcriptomiques d’intérêt. Pour chaque étude, un fichier descriptif de phénotype est nécessaire qui est illustré à la Figure 2. Jeux de gènes annotés (p. ex., voies) sont définis dans le fichier de base de données set de gène (
Des modèles animaux ont longtemps été appliquées pour l’étude des mécanismes des maladies et le développement de nouvelles stratégies thérapeutiques. Cependant, le scepticisme au sujet de la valeur prédictive des modèles animaux commencé à se répandre après les échecs des essais cliniques,12. En outre, des discussions controversées sur les stratégies appropriées pour analyser et interpréter les omiques grandes données issues des essais précliniques ont été soulevées par ...
Les auteurs déclarent qu’ils n’ont aucun intérêt financier concurrentes.
Ce travail a été financé par l’Institut fédéral allemand pour l’évaluation des risques (BfR).
Name | Company | Catalog Number | Comments |
Excel | Microsoft Corporation |
Demande d’autorisation pour utiliser le texte ou les figures de cet article JoVE
Demande d’autorisationThis article has been published
Video Coming Soon