CorExplorer находит связанные с опухолью факторы экспрессии генов таким образом, что математически принципиально с помощью интерактивных визуализаций, а также клинической и базы данных информации для биологических открытий. CorEx выполняет максимизацию информации таким образом, что требуется относительно небольшое количеством образцов для поиска кластеров в высокомерных данных. Иерархия скрытых факторов, которые она производит, облегчает биологическое понимание.
Этот метод уже оказался интересным при применении к биологии рака. Его информационные теоретики делают его применимым к любой системе со многими переменными и небольшими предварительными знаниями об их отношениях. Начните с навигации на главную страницу CorExplorer.
Под Быстрые ссылки, нажмите на кнопку плюс расширить, чтобы увидеть резюме диаграммы фактора CorEx, который был обучен на рак данных, представляющих интерес. Например, здесь показаны графики факторов для данных о раке яичников TCGA. После проверки графиков фактора, нажмите легких TCGA-LUAD для доступа к странице CorExplorer для секвенирования РНК рака легких и использовать окно CorExplorer Фактор Граф для изучения диаграммы фактора CorEx для гена, представляющий интерес.
При перемещении курсора мыши по окну отображения графика фактора увеличьте график фактора с помощью трекпада мыши, чтобы просмотреть детали графика, такие как наиболее важные гены в каждом факторе и связи между узлами в разных слоях. Чтобы найти целевой ген, нажмите меню Gene и ввените имя гена, чтобы выбрать его в списке выпадают. Нажмите Возвращение на клавиатуре, чтобы сделать вид увеличить до фактора, с которым ген интереса наиболее сильно коррелирует.
Перепозиционировать мышь над дисплеем графика и прокрутить, чтобы увеличить, чтобы увидеть уровень узла и связанных с ним факторов, которые являются соседями наиболее тесно связанных генного фактора. Обратите внимание, что показаны только гены с весом, большим, чем порог, указанный на ползунке min Link Weight. Чтобы просмотреть все гены, связанные с фактором, нажмите на соответствующий узел и выберите Load Additional Genes во всплывающем окне.
Когда будет сделано, закройте всплывающее окно. В разделе заголовка нажмите и перетащите модификатор Min Link Weight до 0,05, чтобы гены появились в порядке веса. Чтобы определить ассоциации с биологической функцией, в окне Аннотации неконтролируемое ложное сортировка скорости обнаружения для сортировки меню падения фактора по номеру фактора, а не по ложной скорости обнаружения.
Прокрутите и нажмите, чтобы выбрать фактор интереса в меню высадки окна Аннотации, чтобы выявить аннотации обогащения для фактора. Затем нажмите коэффициент обогащения, чтобы сразу же просмотреть связанные гены, выделенные желтым цветом на дисплее графика. Обратите внимание, что факторы, которые исчезают или отображаются в качестве различных терминов GO, выбираются в зависимости от того, обогащены ли они для генов выбранной аннотацией.
Для фильтра факторов, представляющих интерес, используя выживание и качество кластера, из Dataset падение вниз меню выберите TCGA_OVCA перейдите на страницу CorExplorer для TCGA рака яичников РНК секвенирования. Обратите внимание на окно выживания фактор с самым большим дифференциалом выживания и выберите этот фактор в окне Фактора Граф из меню падения фактора. Нажмите и перетащите ползунок Link Weight до 0,5 и обратите внимание на количество генов в факторе.
Расширьте список факторов в окне выживания и нажмите на следующий лучший фактор в падении окна выживания, чтобы просмотреть связанные с ним кривые выживания. Будут показаны значительные аннотации GO и Kegg. Чтобы лучше понять биологическую роль генов в этом факторе, выберите слой Фактора в верхней части окна Графика фактора и перемести мышь через окно, увеличив масштаб, чтобы выявить весь кластер и связанные с ним факторы.
Чтобы понять относительную значимость факторов, связанных с кластером узла uncheck Сортировать по p-val в окне выживания и нажмите на каждый из чисел фактора подряд, чтобы просмотреть их, упомяняя факторы, которые отображают ассоциации выживания. В меню Add Window выберите PPI и нажмите Добавить, чтобы добавить окно графика PPI в область отображения. В окне графика PPI выберите факторный слой интереса для отображения белково-белковых взаимодействий, которые являются значительными.
Нажмите на ссылку View at StringDB, чтобы подключиться к онлайн-базе данных STRINGdb и нажмите Кнопку Продолжить. Затем откройте вкладку Anaylsis, чтобы получить онлайн-анализ GO для генов сети PPI. Будет отображаться верхний клеточный компонент.
Вернитесь к вкладке CorExplorer и pPI и выберите другой фактор. Нажмите на ссылку View at StringDB еще раз. Будет отображаться другой верхний клеточный компонент.
Затем, в окне PPI, выберите другой фактор для анализа базы данных STRING. Чтобы найти общие черты и различия в вариации экспрессии генов между типами опухолей, нажмите на заголовке CorExplorer, чтобы вернуться на первую страницу и нажмите Поиск, чтобы получить доступ к странице, позволяющей искать все наборы данных на сайте CorExplorer. В поле поиска генов введите имя гена, представляющие интерес, и нажмите Поиск.
Например, как показал FLT1 находится с относительно высоким весом и несколькими различными факторами. Поиск гена BRCA1 в наборе данных о раке легких показывает, что ген наиболее сильно связан с фактором CorEx 26. Обогащение термина GO для этого фактора весьма высоко, при ремонт дна exhibiting ложный тариф открытия только один раз 10 к отрицательным 19.
Выбор также обращает внимание на кластер второго уровня, который L2_8 имеет шесть тесно связанных факторов в детском возрасте. Сеть взаимодействия белка и белка ДНК тесно связана, что еще больше поддерживает тесно связанную функциональность генов в факторе 26. Связанные с этим графики выживания указывают на возможную связь с выживаемостью пациентов, которая должна быть подтверждена в более большом наборе данных.
Начиная с оценки выживаемости может позволить вскрытие факторов, которые коррелируют с улучшением выживаемости, связанные с конкретными группами экспрессии генов. Добавление окна взаимодействия белка и белка для каждого фактора, в свою очередь, облегчает определение возможных объяснений их ассоциаций с выживанием. Важно проверить тепловые карты для каждого фактора, чтобы подтвердить, что модель экспрессии генов имеет адекватное качество для поддержки биологических интерпретаций.
Тепловые карты, показывающие сильные, четкие изменения в моделях экспрессии генов, могут проявлять либо скоординированное выражение генов фактора, начиная от высоких и низких, либо более сложные модели, при этом некоторые гены с низкой экспрессией коррелируют с другими генами с высокой экспрессией. Основная цель этой процедуры состоит в том, чтобы установить персонализированную терапию путем отображения из образца опухоли на факторы CorExplorer для выявления потенциальных опухолевых конкретных методов лечения.