Embora o GWAS tenha identificado com sucesso regiões genômicas associadas a traços e doenças humanas, o impacto biológico dessas variantes de risco não é claro. Aqui descrevemos um protocolo para prever computacionalmente genes-alvo putativos de variantes de risco GWAS usando perfis de interação de cromatina. Muitas vezes, a identificação de genes de risco é um primeiro passo para entender os mecanismos da doença e permitir abordagens terapêuticas normais.
Esperamos que os resultados deste trabalho possam eventualmente levar a estratégias finais para diagnosticar e tratar a doença de Alzheimer. A principal vantagem dessa técnica é que usando frequências de contato de cromoston 3D podemos identificar os genes afetados pela variância de risco da doença de Alzheimer, mesmo que estejam a milhares ou até milhões de pares de bases de distância. Ao tentar este protocolo, a familiaridade com o sistema de pares R ou X é fundamental porque espera-se que o usuário conduza todo o protocolo com o sistema.
Para executar este protocolo computacional, consulte o código no manuscrito do texto ou na tela. Comece, configurando-se em R, para gerar um objeto de alcanceS G para polimorfismos nucleatis nucleatitos únicos ou SNPS críveis. Para mapeamento posicional, configure em R, em seguida, carregue o promotor e a região exônica e gere um objeto de alcance G.
Sobreponha o SNPS crível com as regiões exônicas e com as regiões promotoras. Para vincular o SNPS aos seus genes de destino putativos usando interações Chromaton, carregue o conjunto de dados Hi C e gere um objeto de alcance G. Sobreponha o SNPS confiável com o objeto hi C G.
E compilar genes candidatos a DA, definidos por mapeamento posicional e perfis de interação cromoton. Em seguida, explore trajetórias de desenvolvimento. Configuração em R e processe os metadados de expressão.
Especifique estágios de desenvolvimento e selecione regiões corticais. Extrair os perfis de expressão de desenvolvimento dos genes de risco de DA e comparar os níveis de expressão pré-natal versus pós-natal. Investigue perfis de expressão do tipo celular configurando-se em R e extraindo perfis de expressão celular de risco de AD.
Finalmente, realize a análise de enriquecimento de anotação genética de genes de risco de AD. Baixe e configure Homer. Em seguida, executar Homer e traçar os termos enriquecidos com R Studio.
Um conjunto de 800 SNPs confiáveis foi investigado usando esse processo. O mapeamento posicional revelou que 103 SNPs se sobrepuseram com promotores e 42 SNPs se sobrepuseram aos Exons, enquanto 84% dos SNPs permaneceram não anotados. Usando conjuntos de dados Hi-C no cérebro adulto, 208 SNPs adicionais foram ligados a 64 genes baseados na proximidade física.
No total, 284 SNPs confiáveis de AD foram mapeados para 112 genes de risco de DA. Genes de risco de DA foram associados com proteínas precursoras amiloides, formação beta amiloide e resposta imune, o que reflete a biologia conhecida da doença. Perfis de expressão de desenvolvimento de genes de risco da DA mostraram enriquecimento pós-natal acentuado indicativo do risco elevado associado à idade da doença.
Finalmente, os genes foram altamente expressos em microglia as células imunes primárias no cérebro que suporta os achados recorrentes de que a DA tem uma forte base imune. Aqui usamos dados Hi-C do tecido cerebral para analisar um impacto biológico da variância do risco da Doença de Alzheimer. No entanto, aplicar este método a outro estudo do GWAS o nível dos novos dados Hi-C no tecido relevante é fundamental.
Esses resultados podem ser mais estudados e validados usando tecnologias baseadas em crisper, ensaios de repórteres melhorador ou cruzando-se com outros conjuntos de dados genômicos funcionais, como EQTLs. Aqui identificamos dezenas de genes de risco da doença de Alzheimer e esperamos que a identificação desses genes possa nos ajudar a entender seu papel até então desconhecido na doença de Alzheimer.