Während Die GWAS erfolgreich genomische Regionen identifiziert hat, die mit menschlichen Merkmalen und Krankheiten in Verbindung stehen, sind die biologischen Auswirkungen dieser Risikovarianten unklar. Hier skizzieren wir ein Protokoll zur rechnerisch vorhersagen von vermeintlichen Zielgenen von GWAS-Risikovarianten unter Verwendung von Chromatin-Interaktionsprofilen. Oft ist die Identifizierung von Risikogenen ein erster Schritt, um Krankheitsmechanismen zu verstehen und normale therapeutische Ansätze zu ermöglichen.
Wir hoffen, dass die Ergebnisse dieser Arbeit schließlich zu endgültigen Strategien zur Diagnose und Behandlung der Alzheimer-Krankheit führen könnten. Der Hauptvorteil dieser Technik ist, dass wir durch die Verwendung von 3D-Chromoton-Kontaktfrequenzen die Gene identifizieren können, die von der Risikovarianz der Alzheimer-Krankheit betroffen sind, selbst wenn sie Tausende oder sogar Millionen von Basenpaaren entfernt sind. Beim Versuch dieses Protokolls ist die Vertrautheit mit R oder einem X-Paarsystem von entscheidender Bedeutung, da vom Benutzer erwartet wird, dass er das gesamte Protokoll mit dem System durchführt.
Um dieses Rechenprotokoll auszuführen, beziehen Sie sich auf den Code im Textmanuskript oder auf dem Bildschirm. Beginnen Sie, indem Sie in R einrichten, um ein G-Bereich-Objekt für glaubwürdige, einzelne Nukleatide-Polymorphismen oder SNPS zu generieren. Für die Positionszuordnung wird in R der Promotor und der exonic-Bereich geladen und ein G-Bereichsobjekt generiert.
Überlappen Sie die glaubwürdige SNPS mit den exonischen Regionen und mit den Förderregionen. Um SNPS mithilfe von Chromaton-Interaktionen mit ihren vermeintlichen Zielgenen zu verknüpfen, laden Sie das Hi C-Dataset und generieren Sie ein G-Bereichsobjekt. Überlappen Sie das glaubwürdige SNPS mit dem Hi C G-Bereichsobjekt.
Und kompilieren AD-Kandidatengene, definiert durch Positionskartierung und Chromoton-Interaktionsprofile. Als nächstes erkunden Sie Entwicklungspfade. Richten Sie in R ein, und verarbeiten Sie die Ausdrucksmetadaten.
Geben Sie Entwicklungsstadien an, und wählen Sie kortikale Regionen aus. Extrahieren Sie die Entwicklungsexpressionsprofile von AD-Risikogenen und vergleichen Sie pränatale und postnatale Expressionsniveaus. Untersuchen Sie Zelltyp-Expressionsprofile, indem Sie in R einrichten und zelluläre Expressionsprofile des AD-Risikos extrahieren.
Führen Sie schließlich eine Analyse der Genannotationsanreicherung von AD-Risikogenen durch. Herunterladen und Konfigurieren von Homer. Führen Sie dann Homer aus und zeichnen Sie die angereicherten Begriffe mit R Studio.
Ein Satz von 800 glaubwürdigen SNPs wurde mit diesem Verfahren untersucht. Die Positionskartierung ergab, dass sich 103 SNPs mit Promotern und 42 SNPs mit Exons überschnitten, während 84 % der SNPs unkommentiert blieben. Mithilfe von Hi-C-Datensätzen im erwachsenen Gehirn wurden weitere 208 SNPs mit 64 Genen verknüpft, die auf physischer Nähe basieren.
Insgesamt wurden 284 AD-glaubwürdige SNPs 112 AD-Risikogenen zugeordnet. AD-Risikogene wurden mit Amyloid-Vorläuferproteinen, Amyloid-Beta-Bildung und Immunantwort assoziiert, die die bekannte Biologie der Krankheit widerspiegelt. Entwicklungsexpressionsprofile von AD-Risikogenen zeigten eine deutliche postnatale Anreicherung, die auf das altersassoziierte erhöhte Risiko der Krankheit hindeutet.
Schließlich wurden die Gene in Mikroglia stark exprimiert die primären Immunzellen im Gehirn, die die wiederkehrenden Erkenntnisse unterstützt, dass AD eine starke Immunbasis hat. Hier verwenden wir Hi-C-Daten aus dem Hirngewebe, um eine biologische Auswirkung der Risikovarianz der Alzheimer-Krankheit zu analysieren. Um diese Methode jedoch auf eine andere GWAS-Studie anzuwenden, ist das Niveau der neuen Hi-C-Daten im relevanten Gewebe von entscheidender Bedeutung.
Diese Ergebnisse können weiter untersucht und validiert werden, indem crisper-based-Technologien, Enhancer-Reporter-Assays oder durch Überschneiden mit anderen funktionellen genomischen Datensätzen wie EQTLs, weiter untersucht und validiert werden. Hier identifizieren wir Dutzende von Risikogenen der Alzheimer-Krankheit und wir erwarten, dass die Identifizierung dieser Gene uns helfen kann, ihre bisher unbekannte Rolle bei der Alzheimer-Krankheit zu verstehen.