Bien que le GWAS aient réussi à identifier les régions génomiques associées aux traits et aux maladies humains, l’impact biologique de ces variantes de risque n’est pas clair. Ici, nous décrivons un protocole pour prédire de façon computationnelle les gènes cibles putatifs des variantes de risque GWAS à l’aide de profils d’interaction chromatine. Souvent, l’identification des gènes à risque est une première étape pour comprendre les mécanismes de la maladie et permettre des approches thérapeutiques normales.
Nous espérons que les résultats de ces travaux pourraient éventuellement mener à des stratégies finales pour diagnostiquer et traiter la maladie d’Alzheimer. Le principal avantage de cette technique est qu’en utilisant des fréquences de contact chromoton 3D, nous pouvons identifier les gènes affectés par la variance du risque de la maladie d’Alzheimer, même si elles sont des milliers, voire des millions de paires de base. Lorsque vous essayez ce protocole, la familiarité avec R ou un système de paire X est essentielle parce que l’utilisateur est censé effectuer l’ensemble du protocole avec le système.
Pour effectuer ce protocole computationnel, consultez le code dans le manuscrit du texte ou à l’écran. Commencez, en s’installant en R, à générer un objet de gammes G pour des polymorphismes nucléatides simples crédibles ou SNPS. Pour la cartographie positionnelle, configurer en R puis charger le promoteur et la région exonique et générer un objet de plage G.
Chevaucher le SNPS crédible avec les régions exoniques et avec les régions promoteurs. Pour relier SNPS à leurs gènes cibles putatifs à l’aide des interactions Chromaton, chargez l’ensemble de données Hi C et générez un objet de plage G. Chevauchez le SNPS crédible avec l’objet hi c g.
Et compiler les gènes candidats à la MA, définis par la cartographie positionnelle et les profils d’interaction chromoton. Ensuite, explorez les trajectoires de développement. Configurer en R et traiter les métadonnées d’expression.
Spécifiez les stades de développement et sélectionnez les régions corticales. Extraire les profils d’expression développementale des gènes à risque de LA et comparer les niveaux d’expression prénatale par rapport aux niveaux d’expression postnatale. Étudier les profils d’expression de type cellulaire en s’installant en R et en extrayant les profils d’expression cellulaire du risque de MA.
Enfin, effectuez l’analyse d’enrichissement d’annotation génétique des gènes de risque d’ANNONCE. Téléchargez et configurez Homer. Ensuite, exécutez Homer et tracez les termes enrichis avec R Studio.
Un ensemble de 800 SNP crédibles a fait l’objet d’une enquête à l’aide de ce processus. La cartographie positionnelle a révélé que 103 SNP se chevauchaient avec les promoteurs et que 42 SNP se chevauchaient avec les Exons, tandis que 84 % des SNP n’étaient toujours pas annotés. À l’aide d’ensembles de données Hi-C dans le cerveau adulte, 208 SNP supplémentaires ont été associés à 64 gènes basés sur la proximité physique.
Au total, 284 SNP crédibles ont été cartographiés sur 112 gènes à risque de MA. Les gènes à risque de la MON ont été associés aux protéines précurseurs amyloïdes, à la formation bêta-amyloïde et à la réponse immunitaire, ce qui reflète la biologie connue de la maladie. Les profils d’expression développementale des gènes à risque de LA ont montré un enrichissement postnatal marqué indiquant le risque élevé associé à l’âge de la maladie.
Enfin, les gènes ont été fortement exprimés dans les microglies les cellules immunitaires primaires dans le cerveau qui soutient les résultats récurrents que l’ANNONCE a une base immunitaire forte. Ici, nous utilisons les données Hi-C du tissu cérébral pour analyser un impact biologique de la variance du risque de la maladie d’Alzheimer. Toutefois, il est essentiel d’appliquer cette méthode à une autre étude du GWAS sur le niveau des nouvelles données Hi-C dans le tissu pertinent.
Ces résultats peuvent être étudiés et validés à l’aide de technologies plus nettes, d’analyses de journalistes exhausteurs ou en croisant avec d’autres ensembles de données génomiques fonctionnelles tels que les EQTLs. Ici, nous identifions des dizaines de gènes à risque de la maladie d’Alzheimer et nous nous attendons à ce que l’identification de ces gènes puisse nous aider à comprendre leur rôle jusque-là inconnu dans la maladie d’Alzheimer.