JoVE 비디오를 활용하시려면 도서관을 통한 기관 구독이 필요합니다. 전체 비디오를 보시려면 로그인하거나 무료 트라이얼을 시작하세요.

기사 소개

  • 요약
  • 초록
  • 서문
  • 프로토콜
  • 대표적 결과
  • 토론
  • 공개
  • 감사의 말
  • 자료
  • 참고문헌
  • 재인쇄 및 허가

요약

다양한 전처리 단계, 다중 오믹스 요인 분석 모델 추정 및 여러 다운스트림 분석을 결합한 복잡한 다중 오믹스 데이터 세트의 비감독 분석을 위한 유연하고 확장 가능한 Jupyter-lab 기반 워크플로를 제공합니다.

초록

질병 메커니즘은 일반적으로 복잡하며 몇 가지 뚜렷한 분자 과정의 상호 작용에 의해 제어됩니다. 복잡한 다차원 데이터 세트는 이러한 프로세스에 대한 더 많은 통찰력을 얻을 수 있는 귀중한 리소스이지만, 이러한 데이터 세트의 분석은 예를 들어 다양한 질병 상태, 시점 및 다양한 해상도에서 프로세스를 캡처하는 오믹스에서 발생하는 높은 차원성으로 인해 어려울 수 있습니다.

여기에서는 급성 및 만성 관상동맥 증후군의 면역 반응을 포착하는 혈액 샘플에서 생성된 데이터 세트에 다중 오믹스 요인 분석(MOFA)을 적용하여 이러한 복잡한 다중 오믹스 데이터 세트를 비지도 방식으로 분석하고 탐색하는 접근 방식을 보여줍니다. 데이터 세트는 시료 수준 사이토카인 데이터, 혈장 단백질체학 및 호중구 프라임 염기서열분석, 단일 세포 RNA-염기서열분석(scRNA-seq) 데이터를 포함하여 다양한 해상도의 여러 분석으로 구성됩니다. 환자당 여러 다른 시점을 측정하고 여러 환자 하위 그룹을 측정함으로써 복잡성이 더욱 가중됩니다.

분석 워크플로우는 (1) 데이터 전처리 및 조화, (2) MOFA 모델 추정, (3) 다운스트림 분석의 여러 단계로 데이터를 통합하고 분석하는 방법을 간략하게 설명합니다. 1단계에서는 다양한 데이터 유형의 특징을 처리하고, 품질이 낮은 특징을 필터링하고, 추가 분석을 위해 분포를 일치시키기 위해 정규화하는 방법을 간략하게 설명합니다. 2단계에서는 MOFA 모델을 적용하고 모든 오믹스 및 기능에 걸쳐 데이터 세트 내 분산의 주요 원인을 탐색하는 방법을 보여줍니다. 3단계에서는 캡처된 패턴의 다운스트림 분석을 위한 몇 가지 전략을 제시하여 이를 질병 상태 및 이러한 상태를 지배하는 잠재적인 분자 과정과 연결합니다.

전반적으로, 복잡한 다중 오믹스 데이터 세트의 비지도 데이터 탐색을 위한 워크플로우를 제시하여 다른 컨텍스트 및 다중 오믹스 데이터 세트(예시적인 사용 사례에 제시된 다른 분석 포함)에도 적용할 수 있는 다양한 분자 특징으로 구성된 주요 변동 축을 식별할 수 있도록 합니다.

서문

질병 메커니즘은 일반적으로 복잡하며 몇 가지 뚜렷한 분자 과정의 상호 작용에 의해 제어됩니다. 특정 질병을 유발하거나 질병의 진행을 관장하는 복잡한 분자 메커니즘을 해독하는 것은 질병을 이해하고 치료하기 위한 새로운 통찰력을 제공할 수 있기 때문에 의학적 관련성이 높은 작업입니다.

최근의 기술 발전으로 더 높은 해상도(예: 단일 세포 수준)와 다양한 생물학적 층(예: DNA, mRNA, 염색질 접근성, DNA 메틸화, 단백질체학)에서 이러한 과정을 동시에 측정할 수 있습니다. 이로 인해 대규모 다차원 생물학적 데이터 세트의 생성이 증가하고 있으며, 이를 공동으로 분석하여 기본 프로세스에 대한 더 많은 통찰력을 생성할 수 있습니다. 동시에 생물학적으로 의미 있는 방식으로 다양한 데이터 소스를 결합하고 분석하는 것은 여전히 어려운 작업입니다1.

서로 다른 기술적 한계, 소음 및 서로 다른 오믹스 간의 변동성 범위는 한 가지 문제를 제기합니다. 예를 들어, 단일 세포 RNA 염기서열분석(scRNA-seq) 데이터는 매우 희박하며 종종 대규모 기술 또는 배치 효과의 영향을 받습니다. 또한 특징 공간....

프로토콜

1. 준비: 기술 설정 및 설치

참고: 이 프로그램을 실행하려면 wget, git 및 Apptainer가 장치에 미리 설치되어 있어야 합니다. 다른 시스템(Linux, Windows, Mac)에 Apptainer를 설치하는 방법에 대한 안내는 https://apptainer.org/docs/admin/main/installation.html 여기에서 제공됩니다. git에 대한 설치 정보는 여기에서 찾을 수 있습니다. https://git-scm.com/book/en/v2/Getting-Started-Installing-Git. 다양한 입력 데이터 세트의 크기에 따라 적절한 컴퓨터(CPU 16개, 64GB 메모리)에서 워크플로를 실행하는 것이 좋습니다. 제공된 예제 데이터를 사용한 스모크 테스트를 로컬 컴퓨터에서 실행할 수 있습니다. 예제 데이터에서 프로토콜을 실행한 지침 및 예상 출력은 보충 파일 1에 나와 있습니다. 위에서 설명한 데이터 세트에서 실행되는 프로토콜의 중요한 단계에 대해서는 보충 비디오 파일 1 을 참조하십시오.

  1. 콘솔을 열고 모든 분석 코드와 출력이 저장될 폴....

대표적 결과

워크플로우가 성공적으로 실행되면 그림 2와 같이 여러 테이블과 그림이 생성됩니다. 그림은 /figures 폴더(그림 6, 그림 7, 그림 8, 보충 그림 1, 보충 그림 2, 추가 그림 3, 보충 그림 4)에 배치되고 테이블은 지정된 /r.......

토론

설명된 프로토콜을 사용하면 복잡한 다중 오믹스 데이터 세트를 빠르게 탐색하는 데 사용할 수 있는 확장 가능한 모듈식 Jupyter 노트북 기반 워크플로가 제공됩니다. 워크플로우의 주요 부분은 전처리 및 데이터 조화 부분(데이터 필터링 및 정규화를 위한 다양한 표준 단계 제공), MOFA9 모델 추정 및 몇 가지 예시적인 다운스트림 분석으로 구성됩니다. 가?.......

공개

저자는 이해 상충이 없음을 선언합니다.

감사의 말

CL은 공동 연구 학교인 "Munich School for Data Science - MUDS"에서 Helmholtz Association의 지원을 받고 있습니다.

....

자료

NameCompanyCatalog NumberComments
ApptainerNANAhttps://apptainer.org/docs/admin/main/installation.html
Compute server or workstation or cloud  (Linux, Mac or Windows environment).
Depending on the size of the different input datasets we recommend running the workflow on a suitable machine (in our setting we use: 16 CPU, 64GB Memory)
Any manufacturer16 CPU, 64GB MemoryLarge Memory is only required for the processing of the raw single cell data. After preprocessing the later analysis steps can also be performed on regular desktop or laptop computers
gitNANAhttps://git-scm.com/book/en/v2/Getting-Started-Installing-Git
GitHubGitHubNAhttps://github.com/heiniglab/mofa_workflow

참고문헌

  1. Lähnemann, D., et al. Eleven grand challenges in single-cell data science. Genome Biol. 21 (1), 31 (2020).
  2. Colomé-Tatché, M., Theis, F. J. Statistical single cell multi-omics integration. Curr Opin Syst ....

재인쇄 및 허가

JoVE'article의 텍스트 или 그림을 다시 사용하시려면 허가 살펴보기

허가 살펴보기

더 많은 기사 탐색

RNAMOFA

This article has been published

Video Coming Soon

JoVE Logo

개인 정보 보호

이용 약관

정책

연구

교육

JoVE 소개

Copyright © 2025 MyJoVE Corporation. 판권 소유