JoVE 비디오를 활용하시려면 도서관을 통한 기관 구독이 필요합니다. 전체 비디오를 보시려면 로그인하거나 무료 트라이얼을 시작하세요.
데이터 기반 네트워크 구축 및 대사체학 데이터 분석을 위한 두 가지 도구인 CorrelationCalculator와 Filigree를 소개합니다. CorrelationCalculator는 발현 데이터를 기반으로 대사 산물의 단일 상호 작용 네트워크 구축을 지원하는 반면, Filigree는 차등 네트워크 구축 후 네트워크 클러스터링 및 농축 분석을 수행할 수 있습니다.
오믹스 데이터 분석의 중요한 과제는 실행 가능한 생물학적 지식을 추출하는 것입니다. 대사체학도 예외는 아닙니다. 개별 대사 산물 수준의 변화를 특정 생물학적 과정과 연관시키는 일반적인 문제는 비표적 액체 크로마토그래피-질량 분석법(LC-MS) 연구에 존재하는 많은 수의 알려지지 않은 대사 산물로 인해 더욱 복잡해집니다. 또한, 2차 대사와 지질 대사는 기존 경로 데이터베이스에서 잘 표현되지 않습니다. 이러한 한계를 극복하기 위해 우리 그룹은 데이터 기반 네트워크 구축 및 분석을 위한 몇 가지 도구를 개발했습니다. 여기에는 CorrelationCalculator 및 Filigree가 포함됩니다. 두 도구 모두 사용자가 대사 산물 수가 샘플 수를 초과할 때 실험 대사체학 데이터에서 부분 상관 기반 네트워크를 구축할 수 있도록 합니다. CorrelationCalculator는 단일 네트워크의 구축을 지원하는 반면, Filigree는 두 샘플 그룹의 데이터를 활용한 후 네트워크 클러스터링 및 농축 분석을 통해 차등 네트워크를 구축할 수 있습니다. 실제 대사체학 데이터 분석을 위한 두 도구의 유용성과 응용에 대해 설명합니다.
지난 10년 동안 대사체학은 기체 크로마토그래피-질량분석법(GC-MS) 및 액체 크로마토그래피-질량분석법(LC-MS)과 같은 분석 기술의 발전으로 인해 오믹스 과학으로 부상했습니다. 이러한 기술을 사용하면 수백에서 수천 개의 저분자 대사 산물을 동시에 측정하여 복잡한 다차원 데이터 세트를 생성할 수 있습니다. 대사체학 실험은 표적 또는 비표적 모드에서 수행할 수 있습니다. 표적 대사체학 실험은 특정 종류의 대사 산물을 측정합니다. 일반적으로 가설 중심인 반면, 비표적 접근법은 가능한 한 많은 대사 산물을 측정하려고 시도하며 본질적으로 가설을 생성합니다. 표적 분석에는 일반적으로 내부 표준물질이 포함되므로 관심 대사 산물의 절대적인 정량화가 가능합니다. 대조적으로, 비표적 분석은 상대적 정량화가 가능하며 많은 알려지지 않은 대사 산물을 포함합니다1.
대사체학 데이터 분석은 많은 전문 소프트웨어 도구를 활용하는 다단계 프로세스입니다 1. (1) 데이터 처리 및 품질 관리, (2) 통계 분석, (3) 생물학적 데이터 해석의 세 가지 주요 단계로 나눌 수 있습니다. 여기에 설명된 도구는 분석의 후반 단계를 사용할 수 있도록 설계되었습니다.
대사체학 데이터를 해석하는 직관적이고 인기 있는 방법은 실험 측정값을 대사 경로에 매핑하는 것입니다. 이 2,3,4,5를 달성하기 위해 수많은 도구가 설계되었으며, 그 중에는 우리 그룹6에서 개발한 Metscape도 있습니다. 경로 매핑은 종종 농축 분석과 결합되어 가장 중요한 경로를 식별하는 데 도움이 됩니다 7,8. 이러한 기술은 유전자 발현 데이터 분석에서 처음으로 두각을 나타냈으며 단백질체학 및 후성유전체학 데이터 9,10,11,12,13의 분석에 성공적으로 적용되었습니다. 그러나 대사체학 데이터 분석은 지식 기반 접근 방식에 여러 가지 과제를 제시합니다. 첫째, 내인성 대사 산물 외에도 대사체학 분석은 영양 및 기타 환경 공급원에서 유래한 화합물을 포함한 외인성 화합물을 측정합니다. 박테리아에 의해 생성되는 대사 산물 뿐만 아니라 이 화합물은 다른 진핵 생물의 인간 또는 대사 경로에 지도로 나타낼 수 없습니다. 또한, 2차 대사 및 지질 대사의 경로 커버리지는 현재 데이터의 생물학적 해석을 쉽게 지원할 수 있는 수준의 고해상도 매핑을 허용하지 않는다14,15.
데이터 기반 네트워크 분석 기술은 이러한 문제를 극복하는 데 도움이 될 수 있습니다. 예를 들어, 상관 기반 네트워크는 알려진 대사산물과 알려지지 않은 대사산물 사이의 관계를 도출하고 미지의 대사산물16의 주석을 용이하게 하는 데 도움이 될 수 있다. Pearson의 상관 계수를 계산하는 것은 대사 산물 간의 선형 관계를 설정하는 가장 간단한 접근 방식이지만, 단점은 직접 및 간접 연관성을 모두 포착한다는 것입니다17,18,19. 또 다른 방법은 직접 연관과 간접 연관을 구분할 수 있는 편상관 계수를 계산하는 것입니다. 가우스 그래픽 모델링(GGM)을 사용하여 편상관 네트워크를 추정할 수 있습니다. 그러나 GGM에서는 표본 크기와 특징 수가 비슷해야 합니다. 이 조건은 수천 개의 대사 특징에 대한 측정값을 포함하는 비표적 LC-MS 데이터에서 거의 충족되지 않습니다. 이러한 한계를 극복하기 위해 정규화 기술을 활용할 수 있습니다. 그래픽 올가미(Glasso) 및 노드별 회귀는 편상관 신경망(16,20)의 정규화된 추정에 널리 사용되는 방법이다.
여기에 제시된 첫 번째 생물정보학 도구인 CorrelationCalculator16은 DSPC(Debiased Sparse Partial Correlation) 알고리즘을 기반으로 합니다. DSPC는 희소화 해제된 그래픽 올가미 모델링에 의존합니다. 알고리즘의 기본 가정은 대사 산물 간의 연결 수가 샘플 수보다 상당히 적다는 것, 즉 대사 산물의 편상관 네트워크가 희박하다는 것입니다. 이 가정을 통해 DSPC는 정규화된 회귀 기법을 활용하여 더 적은 수의 샘플을 사용하여 많은 수의 대사 산물 간의 연결성을 발견할 수 있습니다. 또한 정규화 회귀 추정치에 대한 편향 제거 단계를 사용하여 신뢰 구간을 구성하고 관심 가설(예: 단일 또는 간선 그룹의 존재/부재)을 테스트하는 데 사용할 수 있는 간선 매개변수에 대한 표본 추출 분포를 얻습니다. 따라서 편상관 네트워크에서 에지의 존재 여부는 계산된 p-값을 사용하여 공식적으로 테스트할 수 있습니다.
CorrelationCalculator는 단일 그룹 분석에 매우 유용한 것으로 입증되었다16; 그러나 많은 대사체학 실험의 목적은 두 개 이상의 조건을 차등 분석하는 것입니다. CorrelationCalculator를 각 그룹에 개별적으로 사용하여 각 조건에 대한 편상관 신경망을 생성할 수 있지만, 이 접근 방식은 신경망 생성에 사용할 수 있는 샘플 수를 제한합니다. 충분히 큰 표본 크기는 데이터 기반 분석에서 가장 큰 고려 사항 중 하나이므로 데이터에서 사용 가능한 모든 표본을 활용하여 네트워크를 구성할 수 있는 방법이 매우 바람직합니다. 이 접근 방식은 여기에 제시된 두 번째 도구인 Filigree21에서 구현됩니다. 선조는 이전에 발표된 DNEA(Differential Network Enrichment Analysis) 알고리즘22에 의존합니다. 표 1 은 두 도구의 응용 분야와 작업 흐름을 보여줍니다.
실험 조건의 수(k) | 케이 = 1 | 케이 = 2 |
소프트웨어 도구 | 상관 계산기 | 선조 |
입력 데이터 | • 대사 산물 x 샘플 데이터 매트릭스 | • 대사 산물 x 샘플 데이터 매트릭스 • 실험 그룹 |
워크플로 •전처리 • 네트워크 추정 • 네트워크 클러스터링 • 농축 분석 | • 로그 변환; 자동 확장 • DSPC (주)디에스피씨 • 외부 앱을 통해 •아니요 | • 로그 변환; 자동 확장 • 공동 네트워크 추정 • 합의 클러스터링 • 넷GSA |
데이터 시각화 | 외부 앱(예: Cytoscape)을 통해 | 외부 앱(예: Cytoscape)을 통해 |
관심 결과와의 연관성에 대한 대사 모듈 테스트(선택 사항) | 외부 앱을 통해 | 외부 앱을 통해 |
표 1: 적용 범위와 CorrelationCalculator 및 Filigree의 작업 흐름.
1. 상관 계산기
2. 선조
3. 추가 고려 사항
CorrelationCalculator의 사용을 설명하기 위해 Krumsiek et al.24에 설명된 KORA 인구 연구의 대사체학 데이터의 하위 집합을 사용하여 부분 상관 네트워크를 구성했습니다. 데이터 세트에는 151개의 대사 산물과 240개의 샘플이 포함되어 있습니다. 그림 1 은 Cytoscape에서 시각화된 결과 편상관 네트워크를 보여줍니다. 네트워크에는 148개의 노드와 272개의 Edge가 포...
CorrelationCalculator 및 Filigree에 구현된 부분 상관 기반 네트워크 분석 방법은 특히 알려지지 않은 대사 산물의 유병률이 높고 대사 경로의 범위가 제한된 데이터 세트(예: 지질체학 데이터)에 대한 지식 기반 대사 경로 분석의 일부 한계를 극복하는 데 도움이 됩니다. 이러한 도구는 광범위한 대사체학 및 지질체학 데이터를 분석하기 위해 연구 커뮤니티에서 널리 사용되어 왔습니다 14,22,27,28,29,30.
저자는 경쟁하는 재정적 이익이 없습니다.
이 연구는 NIH 1U01CA235487 보조금의 지원을 받았습니다.
Name | Company | Catalog Number | Comments |
CorrelationCalculator | JAVA | http://metscape.med.umich.edu/calculator.html | |
clusterNet | https://github.com/Karnovsky-Lab/clusterNet | ||
Cytoscape | Cytoscape | https://cytoscape.org/ | |
Filigree | JAVA | http://metscape.med.umich.edu/filigree.html | |
MetScape | Cytoscape | https://apps.cytoscape.org/apps/metscape | Cytoscape application that allows for the creation and exploration of correlation networks. |
JoVE'article의 텍스트 или 그림을 다시 사용하시려면 허가 살펴보기
허가 살펴보기더 많은 기사 탐색
This article has been published
Video Coming Soon
Copyright © 2025 MyJoVE Corporation. 판권 소유