Хотя GWAS успешно идентифицировала геномные регионы, связанные с человеческими чертами и болезнями, биологическое воздействие этих вариантов риска неясно. Здесь мы наметим протокол для расчетного прогнозирования целевых генов вариантов риска GWAS с использованием профилей взаимодействия хроматина. Часто выявление генов риска является первым шагом для понимания механизмов заболевания, и позволяют нормальные терапевтические подходы.
Мы надеемся, что результаты этой работы могут в конечном итоге привести к окончательным стратегиям диагностики и лечения болезни Альцгеймера. Основным преимуществом этого метода является то, что с помощью 3D хромотонных контактных частот мы можем определить гены, затронутые дисперсией риска болезни Альцгеймера, даже если они тысячи или даже миллионы базовых пар прочь. При попытке этого протокола, знакомство с R или X парной системы имеет решающее значение, потому что пользователь должен провести весь протокол с системой.
Для выполнения этого вычислительного протокола обратитесь к коду в текстовой рукописи или на экране. Начните с настройки в R, чтобы создать объект G диапазонов для достоверных, одноядерных полиморфизмов или SNPS. Для позиционного картирования настройка в R затем загружает промоутер и экзоническую область и генерирует объект диапазона G.
Перекрытие надежных SNPS с экзоничными регионами и с промоутер регионов. Чтобы связать SNPS с их целевыми генами с помощью взаимодействий Chromaton, загрузите набор данных Hi C и создайте объект диапазона G. Перекрытие надежного SNPS с объектом диапазона Hi C G.
И компиляция генов-кандидатов AD, определяемых позиционным картографированием и профилями взаимодействия хромотона. Далее изучите траектории развития. Настройка в R и процесс выражения метаданных.
Укажите этапы развития и выберите корковые области. Извлекайте профили экспрессии генов риска АД и сравните уровни пренатальной и послеродовой экспрессии. Исследуйте профили выражения типа клеток, навеяв r и извлекая профили клеточного выражения риска АД.
Наконец, выполнить анализ обогащения гена аннотации генов риска АД. Скачать и настроить Гомера. Затем запустите Гомера и сюжет обогащенных терминов с R Studio.
Набор из 800 надежных SNPs был исследован с помощью этого процесса. Позиционное картирование показало, что 103 SNPs пересекаются с промоутерами и 42 SNPs пересекаются с Exons, в то время как 84% SNPs остались неотмеченными. Используя наборы данных Hi-C во взрослом мозге, дополнительные 208 SNPs были связаны с 64 генами, основанными на физической близости.
В общей сложности, 284 AD надежных SNPs были отображены на 112 AD генов риска. Гены риска АД были связаны с белками-предшественниками амилоидов, образованием амилоидной бета-версии и иммунным ответом, который отражает известную биологию болезни. Профили экспрессии генов риска АД показали заметное послеродовое обогащение, свидетельствующее о возрастном повышенном риске заболевания.
Наконец, гены были высоко выражены в микроглии первичных иммунных клеток в головном мозге, который поддерживает периодические выводы, что АД имеет сильную иммунную основу. Здесь мы используем Hi-C данные из ткани мозга для анализа биологического воздействия дисперсии риска болезни Альцгеймера. Однако, чтобы применить этот метод к другому исследованию GWAS уровень новых данных Hi-C в соответствующих тканях имеет решающее значение.
Эти результаты можно дополнительно изучить и проверить с помощью более четких технологий, анализов репортеров-усилителей или путем пересечения с другими функциональными наборами геномных данных, такими как E'TL. Здесь мы определяем десятки генов риска болезни Альцгеймера, и мы ожидаем, что выявление этих генов может помочь нам понять их ранее неизвестную роль в болезни Альцгеймера.