JoVE 비디오를 활용하시려면 도서관을 통한 기관 구독이 필요합니다. 전체 비디오를 보시려면 로그인하거나 무료 트라이얼을 시작하세요.
Method Article
임상 메타단백질체학(Clinical metaproteomics)은 인간 마이크로바이옴과 질병에 대한 기여에 대한 통찰력을 제공합니다. 당사는 Galaxy 플랫폼의 컴퓨팅 파워를 활용하여 복잡한 질량 분석 기반 메타단백질체 분석 및 질병 연구와 관련된 다양한 임상 샘플 유형의 특성화를 용이하게 하는 모듈식 생물정보학 워크플로우를 개발했습니다.
임상 메타단백질체학(metaproteomics)은 질병의 기저에 있는 숙주-마이크로바이옴 상호작용을 밝힙니다. 그러나 이 접근 방식에는 문제가 있습니다. 특히, 숙주 단백질에 비해 상대적으로 낮은 농도로 존재하는 미생물 단백질의 특성을 규명하는 것은 어렵습니다. 다른 중요한 과제는 매우 큰 단백질 염기서열 데이터베이스를 사용하는 것인데, 이는 분류 및 기능 주석을 검색하고 통계 분석을 수행하는 것 외에도 질량 분석 데이터에서 펩타이드 및 단백질을 식별하는 동안 감도와 정확성을 방해합니다. 이러한 문제를 해결하기 위해 당사는 맞춤형 단백질 염기서열 데이터베이스 생성, 펩타이드 스펙트럼 일치 생성 및 검증, 정량화, 분류학 및 기능 주석, 통계 분석을 결합한 질량 분석 기반 메타단백질체학을 위한 통합 생물정보학 워크플로우를 제시합니다. 이 워크플로우는 또한 인간 단백질의 특성화를 제공하여(미생물 단백질의 우선 순위를 지정함) 질병에서 숙주-미생물 역학에 대한 통찰력을 제공합니다. 도구와 워크플로우는 Galaxy 에코시스템에 배포되어 이러한 컴퓨팅 리소스의 개발, 최적화 및 보급을 가능하게 합니다. 당사는 비인두 면봉 및 기관지폐포 세척액과 같은 수많은 임상 샘플 유형의 후단백질체학 분석에 이 워크플로우를 적용했습니다. 여기에서는 자궁경부 면봉의 잔류 유체 분석을 통해 그 유용성을 입증합니다. Galaxy Training Network에서 전체 워크플로우 및 동반 교육 리소스에 액세스할 수 있으므로 비전문가 및 숙련된 연구원이 데이터를 분석하는 데 필요한 지식과 도구를 제공할 수 있습니다.
질량분석법(MS) 기반 메타단백질체학은 임상 샘플에서 미생물 및 인간 단백질을 식별하고 정량화합니다. 이 접근법은 질병에 대한 마이크로바이옴 반응에 대한 새로운 이해를 제공하고 숙주-마이크로바이옴 상호 작용의 잠재적 매개체를 밝힙니다 1,2. 임상 샘플의 메타단백질체학 분석을 통해 마이크로바이옴과 숙주 환경의 상호 작용을 밝혀낼 수 있지만, 이 분야는 여전히 많은 과제에 직면해 있습니다. 한 가지 주요 과제는 숙주(인간) 단백질의 상대적으로 높은 함량이며, 이는 풍부하고 낮은 미생물 단백질의 식별을 방해합니다. 또한 MS 기반 전단백질체학은 매우 큰 단백질 염기서열 데이터베이스의 사용에 의존합니다. 이러한 데이터베이스는 샘플에 존재하는 미생물 단백질체로 구성되며, 이로 인해 수백만 개의 염기서열을 포함하는 대규모 데이터베이스가 생성될 수 있습니다. 트립티컬하게 절단된 단백질에서 탠덤 질량 분석법(MS/MS) 스펙트럼을 생성한 후, MS/MS 스펙트럼을 대규모 단백질 염기서열 데이터베이스에서 검색하여 펩타이드 염기서열을 각 스펙트럼(펩타이드-스펙트럼 일치 또는 PSM)과 일치시킵니다. 그러나 민감도가 감소하고 전이단백질체학(metaproteomics)에 사용되는 대규모 데이터베이스에서 위양성(false positive)이 발생할 가능성이 증가합니다3. 또한, 분류군 전반에 걸쳐 보존된 단백질 염기서열과 인코딩된 단백질에 대한 불충분한 주석은 검출된 펩타이드 및 단백질에 대한 분류학적 및 기능적 주석을 제한합니다 4,5. 우리는 이러한 많은 문제를 해결하고 연구자가 인간 질병의 기저에 있는 숙주-마이크로바이옴 역학을 조사할 수 있도록 접근 가능한 소프트웨어 리소스를 제공하는 임상 샘플의 효과적인 메타단백질체학 분석을 위한 생물정보학 워크플로우를 제시합니다.
임상 메타단백질체학은 질병 및 상태의 병원성 메커니즘을 해독하기 위해 대변 및 질 면봉을 포함한 다양한 샘플 유형을 조사하는 데 사용되었습니다 6,7,8,9,10,11,12,13,14,15,16,17,18 ,19,20. 여기에서는 메타단백질체학 생물정보학 워크플로우를 사용하여 난소암(OVCA) 및 비 OVCA 환자의 자궁경부암 검사 유체(PTF) 샘플에서 MS/MS 데이터의 하위 집합을 분석합니다21. 소프트웨어 도구 및 워크플로우는 Galaxy 플랫폼을 통해 액세스할 수 있으며, 이는 복잡한 임상 메타단백질체학 워크플로우의 개발 및 실행을 간소화합니다 22,23,24,25. Galaxy는 생물정보학 및 컴퓨터 생물학을 위해 설계된 오픈 소스 플랫폼입니다. 학술 연구원이 복잡한 데이터 분석을 수행하고 공유할 수 있는 오픈 소스 도구 및 워크플로를 사용할 수 있는 웹 기반 환경을 제공합니다. 소프트웨어 개발자, 데이터 사이언티스트 및 최종 사용자로 구성된 번창하는 글로벌 커뮤니티는 온라인 및 주문형 교육 리소스를 제공하는 GTN(Galaxy Training Network, https://training.galaxyproject.org/)을 포함하여 Galaxy 에코시스템을 유지 관리합니다 22,23,24,25,26,27. 당사의 워크플로우는 임상 샘플에서 숙주-미생물 역학에 대한 새로운 이해를 밝히고 임상 샘플의 추가 연구를 위한 표적 MS 기반 임상 분석을 개발하기 위한 새롭고 잘 특성화된 펩타이드 표적을 생성하는 것을 목표로 합니다 6,20,28. 또한, 이 원고는 임상 메타단백질체학 워크플로우 방법론을 강조하고자 합니다. GTN(https://training.galaxyproject.org/)에는 다루지 않은 추가 설명을 원하는 사용자를 위해 이 원고와 병행하여 사용할 수 있는 귀중한 리소스이므로 보다 자세하고 초보자 친화적인 가이드가 제공됩니다. 갤럭시 커뮤니티는 갤럭시 플랫폼 20,21,22,23,24,25,26,27의 초보자 사용자를 돕기 위해 수많은 원고를 저술했습니다.
이 원고에 대한 모든 보충 표(예: 도구 매개변수) 및 그림(예: 예시 플롯)은 별도의 파일로 제공되었으며 그에 따라 참조됩니다. 이 원고에는 Galaxy 버전 2.3.0의 현재 도구 버전이 사용되었습니다. 따라서 Galaxy 및 도구 버전 업데이트에 따라 결과가 약간 다를 수 있습니다. Galaxy 플랫폼과 해당 도구는 오픈 소스이며 학술 연구 목적으로 사용할 수 있습니다.
Access restricted. Please log in or start a trial to view this content.
MS/MS 스펙트럼 데이터는 앞서 설명한 바와 같이 기관 이사회가 승인한 지침 및 규정에 따라 수집된 비식별화된 잔류 PTF 샘플에서 얻었습니다 21,29,30.
참고: 그림 1 은 5개의 모듈로 구성된 전체 워크플로우에 대한 개요를 제공합니다. 모든 입력, 출력 및 소프트웨어 도구는 보충 표 1에 요약되어 있습니다.
그림 1: Galaxy의 임상 메타단백질체학 워크플로우 모듈 요약. 전체 임상 메타단백질체학 워크플로우는 데이터베이스 생성, 발견, 검증, 정량화 및 데이터 해석의 5개 모듈로 구성됩니다. (A) 대규모 종합 데이터베이스에는 샘플에 존재하는 것으로 생각되는 미생물 종의 단백질 염기서열, 인간 및 일반적인 오염 물질이 포함됩니다. MetaNovo 소프트웨어 도구는 MS/MS 스펙트럼 데이터를 펩타이드와 직접 일치시키고 원시 MS 데이터 및 대규모 입력 단백질 염기서열 데이터베이스에서 단백질과 그 원천 유기체를 추론하여 축소된 데이터베이스를 생성했습니다33. 그런 다음 MetaNovo의 축소된 데이터베이스를 인간 및 오염 물질 단백질과 병합하여 펩타이드 발견을 위한 데이터베이스를 생성합니다. (나)두 가지 펩타이드 식별 알고리즘인 SearchGUI/PeptideShaker 및 MaxQuant는 펩타이드 염기서열을 MS/MS 스펙트럼 및 타겟 디코이 단백질 데이터베이스와 일치시킵니다49. (씨)SearchGUI/PeptideShaker 및 MaxQuant에 의해 식별된 펩타이드는 다음으로 PepQuery2를 사용하여 검증됩니다. PepQuery2는 추정되는 것으로 확인된 미생물 펩타이드 염기서열과 일치하는 MS/MS 스펙트럼을 인간 숙주 단백질체 및/또는 오염 물질에 대한 다른 잠재적 일치와 엄격하게 재검사하여 신뢰도가 높은 미생물 일치를 검증합니다40,41. 검증된 펩타이드는 펩타이드 및 단백질 정량화에 사용될 검증된 단백질 염기서열 데이터베이스를 생성하는 데 사용됩니다. (D) MaxQuant42는 검증된 단백질 염기서열에 대해 MS/MS 데이터를 검색하고 인간 단백질과 함께 미생물 펩타이드 및 추론된 단백질을 정량화합니다. (E) Unipept45 및 MSstatsTMT46은 최종 단계에서 분류 및 기능 정보(효소 커미션 가입)로 단백질에 주석을 달고 화산 및 비교 플롯을 생성하는 데 사용됩니다. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.
1. TMT 라벨링 및 MS/MS 스펙트럼 생성
2. 모듈 설정
참고: 버튼/메뉴 선택은 굵게 표시됩니다. 예제 파일, 워크플로우 및 도구 매개변수는 보충 표를 통해 액세스할 수 있습니다. 갤럭시 이용 방법에 대한 자세한 내용은 GTN 자주 묻는 질문 페이지(https://training.galaxyproject.org/training-material/faqs/galaxy/)에서 확인할 수 있습니다.
3. 모듈 1: 단백질 염기서열 데이터베이스 생성
참고: 사용자가 보충 표 2의 예제 입력 및 워크플로를 사용하려는 경우 섹션 2의 지침을 따라야 합니다. 모듈 1의 경우 DATABASE GENERATION에 대한 입력 및 워크플로를 가져옵니다. 보충 표 2 의 출력 열에는 참조를 위해 완료된 출력 기록의 예가 포함되어 있습니다. 모든 모듈의 경우 해당 GTN 튜토리얼은 보충 표 3에서 찾을 수 있습니다.
4. 모듈 2: 데이터베이스 검색을 통한 펩타이드 발견
참고: 사용자가 보충 표 2의 예제 입력 및 워크플로를 사용하려는 경우 섹션 2의 지침을 따라야 합니다. 모듈 2의 경우 DISCOVERY에 대한 입력 및 워크플로를 가져옵니다. 모든 모듈의 경우 해당 GTN 튜토리얼은 보충 표 3에서 찾을 수 있습니다. SearchGUI 34,35,36 및 PeptideShaker37은 별도의 소프트웨어이지만 함께 사용되므로 하나의 펩타이드 식별 및 처리 프로그램으로 간주됩니다. 소프트웨어 호환성을 위해 MS/MS 데이터 세트는 제공된 워크플로우에서 msconvert 도구를 사용하여 SearchGUI/PeptideShaker용 RAW에서 MGF로 변환됩니다. MaxQuant38은 RAW 파일을 처리할 수 있습니다.
5. 모듈 3: 미생물 펩타이드 검증
참고: 사용자가 보충 표 2의 예제 입력 및 워크플로를 사용하려는 경우 섹션 2의 지침을 따라야 합니다. 모듈 2의 경우 VERIFICATION에 대한 입력과 워크플로를 가져옵니다. 모든 모듈의 경우 해당 GTN 튜토리얼은 보충 표 3에서 찾을 수 있습니다.
6. 모듈 4: MaxQuant 정량화
참고: 사용자가 보충 표 2의 예제 입력 및 워크플로를 사용하려는 경우 섹션 2의 지침을 따라야 합니다. 모듈 2의 경우 QUANTIFICATION에 대한 입력 및 워크플로를 가져옵니다. 모든 모듈의 경우 해당 GTN 튜토리얼은 보충 표 3에서 찾을 수 있습니다.
7. 모듈 5: 데이터 해석
참고: 사용자가 보충 표 2의 예제 입력 및 워크플로를 사용하려는 경우 섹션 2의 지침을 따라야 합니다. 모듈 2의 경우 DATA INTERPRETATION에 대한 입력 및 워크플로를 가져옵니다. 모든 모듈의 경우 해당 GTN 튜토리얼은 보충 표 3에서 찾을 수 있습니다. 이전 모듈의 MaxQuant 정량화 출력은 여기에서 Unipept를 사용한 분류 및 기능 주석과 MSstatsTMT를 사용한 통계 분석에 사용됩니다. Unipept를 통해 연구원은 다양한 환경 내에서 미생물을 식별하고 정량화할 수 있으며 공용 데이터베이스(예: UniProt)와 통합되어 업데이트된 주석을 검색할 수 있습니다. MSstatsTMT는 TMT 라벨링을 사용하여 질량 분석 기반 정량적 단백질체학 데이터의 강력한 통계 분석을 위해 설계되었습니다.
Access restricted. Please log in or start a trial to view this content.
여기에 설명된 일반 프로토콜은 PTF 샘플(21)의 서브세트로부터 얻어진 MS/MS 파일에 대해 시연되었다. Do et al.21은 Boylan et al.29및 Afiuni-Zadel et al.30에 의해 기술된 절차에 따라 수집된 PTF 샘플에서 4개의 MS/MS 파일을 분석했습니다. 이 워크플로우는 미생물 단백질에 우선순위를 두지만 미생물 단백질과 병?...
Access restricted. Please log in or start a trial to view this content.
임상 메타단백질체학 연구는 임상 연구에 잠재적인 돌파구를 제공하지만, 그 구현에는 여전히 어려움이 있습니다. 대부분의 샘플에서 숙주 단백질에 비해 미생물 단백질의 함량이 낮기 때문에 비숙주 단백질의 검출 및 특성화를 방해합니다 6,10. 정확한 펩타이드 및 단백질 식별 및 정량화를 위한 대규모 단백질 염기서열 데이?...
Access restricted. Please log in or start a trial to view this content.
저자는 이해 상충이 없음을 선언합니다.
파일럿 데이터 세트를 제공해 주신 Amy Skubitz 박사와 Kristin Boylan 박사(미네소타 대학교)에게 감사드리며, 시료 채취 및 PTF 시료 처리와 이 연구에 사용된 TMT 표지 MS 데이터 생성에 대한 전문 지식을 제공해 주신 Paul Piehowski 박사, Tao Liu 박사, Karin Rodland 박사(PNNL)에게 감사드립니다. 이 프로젝트는 미네소타 난소암 연합(Minnesota Ovarian Cancer Alliance, MOCA), 미국 국립보건원(National Institutes of Health)/국립암연구소(National Cancer Institute) 보조금 번호: 5R01CA262153(A.P.N.S.), 1R21CA267707(P.D.J 및 T.J.G.), 미국 국립보건원(National Institutes of Health)/국립암 연구소(National Cancer Institute) 보조금 번호: P30CA077598(P.D.J. 및 T.J.G.)의 지원을 받았습니다.
Access restricted. Please log in or start a trial to view this content.
Name | Company | Catalog Number | Comments |
Collapse Collection | GalaxyP | Galaxy Version 5.1.1 | Combines a dataset list collection into a single file (in the order of the list) |
Concatenate datasets | GalaxyP | Galaxy Version 0.1.1 | Concatenate files tail-to-head |
Cut | GalaxyP | Galaxy Version 1.0.2 | Cut (select) specified columns from a file |
FASTA Merge Files and Filter Unique Sequences | GalaxyP | Galaxy Version 1.2.0 | Concatenate FASTA database files together |
FastaCLI | GalaxyP | Galaxy Version 4.0.41+galaxy1 | Appends decoy sequences to FASTA files |
FASTA-to-Tablular | GalaxyP | Galaxy Version 1.1.0 | Convert FASTA-formatted sequences to TAB-delimited format |
Filter | GalaxyP | Galaxy Version 1.1.1 | Filter columns using simple expressions |
Filter Tabular | GalaxyP | Galaxy Version 3.3.0 | Filter a tabular file via line filters |
Galaxy Europe (EU) server | GalaxyP | https://usegalaxy.eu/ | |
Group | GalaxyP | Galaxy Version 2.1.4 | Group a file by a particular column and perform aggregate functions |
Identification Parameters | GalaxyP | Galaxy Version 4.0.41+galaxy1 | Set identification parameters for SearchGUI/PeptideShaker |
Learning Pathway: Clinical metaproteomics workflows within Galaxy | GalaxyP | https://training.galaxyproject.org/training-material/learning-pathways/clinical-metaproteomics.html | |
MaxQuant | GalaxyP | Galaxy Version 2.0.3.0+galaxy0 (Discovery module); Galaxy Version 1.6.17.0+galaxy4 (Quantification module) | Quantitative proteomics software package for analysis of large mass spectrometric data files |
MetaNovo | GalaxyP | Galaxy Version 1.9.4+galaxy4 | Search MS/MS data against a FASTA database (of known proteins) to produce a targeted database (of matched proteins) for mass spectrometry analysis |
msconvert | GalaxyP | Galaxy Version 3.0.20287.2 | Convert and/or filter mass spectrometry files |
MSstatsTMT | GalaxyP | Galaxy Version 2.0.0+galaxy1 | R-based package for detection of differentially abundant proteins in shotgun mass spectrometry-based proteomic experiments using tandem mass tag (TMT) labeling |
PepQuery2 | GalaxyP | Galaxy Version 2.0.2+galaxy0 | Peptide-centric search engine for identification and/or validating known and novel peptides of interest |
PeptideShaker | GalaxyP | Galaxy Version 2.0.33+galaxy1 | Interpret results from SearchGUI for protein identification |
Protein Database Downloader | GalaxyP | Galaxy Version 0.3.4 | Download specified protein sequences as a FASTA file |
Query Tabular | GalaxyP | Galaxy Version 3.3.0 | Load tabular files intoa SQLite database |
Remove beginning | GalaxyP | Galaxy Version 1.0.0 | Remove the specified number of (header) lines from a file |
SearchGUI | GalaxyP | Galaxy Version 4.0.41+galaxy1 | Run search engines on MGF peak lists and prepare results for input to Peptide Shaker |
Select | GalaxyP | Galaxy Version 1.0.4 | Select lines that match an expression |
Unipept | GalaxyP | Galaxy Version 4.5.1 | Retrieve UniProt entries and taxonomic information for tryptic peptides |
UniProt | GalaxyP | Galaxy Version 2.3.0 | Download proteome as a XML (UniProtXML) or FASTA file from UniProtKB |
Access restricted. Please log in or start a trial to view this content.
JoVE'article의 텍스트 или 그림을 다시 사용하시려면 허가 살펴보기
허가 살펴보기This article has been published
Video Coming Soon
Copyright © 2025 MyJoVE Corporation. 판권 소유