JoVE 비디오를 활용하시려면 도서관을 통한 기관 구독이 필요합니다. 전체 비디오를 보시려면 로그인하거나 무료 트라이얼을 시작하세요.
Method Article
이 프로토콜은 사용자가 CUT&RUN 염기서열분석 데이터의 초기 분석 및 검증을 완료할 수 있도록 하는 입문용 CUT&RUN 분석 파이프라인을 통해 생물정보학 초보자를 안내합니다. 여기에 설명된 분석 단계를 다운스트림 피크 주석과 함께 완료하면 사용자는 크로마틴 조절에 대한 기계론적 통찰력을 얻을 수 있습니다.
CUT&RUN 기법은 게놈 전반에서 단백질-DNA 상호 작용의 검출을 용이하게 합니다. CUT&RUN의 일반적인 응용 분야에는 히스톤 꼬리 변형의 변화를 프로파일링하거나 전사 인자 크로마틴 점유를 매핑하는 것이 포함됩니다. CUT&RUN의 광범위한 채택은 부분적으로 기존 ChIP-seq에 비해 낮은 세포 입력 요구 사항, 더 낮은 염기서열 분석 깊이 요구 사항, 항체 에피토프를 마스킹하는 가교 결합제의 부족으로 인한 배경 신호 감소로 인한 민감도 증가 등의 기술적 이점에 의해 주도됩니다. CUT&RUN의 광범위한 채택은 Henikoff 실험실의 관대한 시약 공유와 초보자를 위한 채택을 가속화하기 위한 상용 키트 개발을 통해 달성되었습니다. CUT&RUN의 기술 채택이 증가함에 따라 CUT&RUN 염기서열분석 분석 및 검증은 주로 습식 실험실 팀에서 완전히 채택할 수 있도록 극복해야 하는 중요한 병목 현상이 되고 있습니다. CUT&RUN 분석은 일반적으로 염기서열분석 깊이, 판독 품질 및 잠재적 바이어스를 평가하기 위해 원시 염기서열분석 판독에 대한 품질 관리 검사로 시작됩니다. 그런 다음 판독을 참조 게놈 염기서열 어셈블리에 정렬하고, 이후 여러 생물정보학 도구를 사용하여 단백질 농축의 게놈 영역에 주석을 달고, 데이터 해석 가능성을 확인하고, 생물학적 결론을 도출합니다. CUT&RUN 데이터 분석을 지원하기 위해 여러 인실리코(in silico ) 분석 파이프라인이 개발되었지만, 복잡한 다중 모듈 구조와 여러 프로그래밍 언어의 사용으로 인해 여러 프로그래밍 언어에 익숙하지 않을 수 있지만 CUT&RUN 분석 절차를 이해하고 분석 파이프라인을 사용자 정의하려는 생물정보학 초보자에게는 플랫폼이 어렵습니다. 여기에서는 모든 수준의 생물정보학 경험이 있는 사용자를 위해 설계된 단일 언어 단계별 CUT&RUN 분석 파이프라인 프로토콜을 제공합니다. 이 프로토콜에는 염기서열분석 데이터가 생물학적 해석에 적합한지 검증하기 위한 중요한 품질 검사를 완료하는 것이 포함됩니다. 이 기사에서 제공하는 소개 프로토콜을 따르면 다운스트림 피크 주석과 함께 사용자가 자신의 CUT&RUN 데이터 세트에서 생물학적 통찰력을 얻을 수 있을 것으로 기대합니다.
단백질과 게놈 DNA 간의 상호 작용을 측정하는 능력은 염색질 조절의 생물학을 이해하는 데 필수적입니다. 주어진 단백질에 대한 염색질 점유율을 측정하는 효과적인 분석은 적어도 두 가지 핵심 정보, 즉 i) 게놈 국소화 및 ii) 주어진 게놈 영역에서의 단백질 풍부도를 제공합니다. 크로마틴에서 관심 있는 단백질의 모집 및 국소화 변화를 추적하면 단백질의 직접적인 표적 위치를 밝히고 전사 조절, DNA 복구 또는 DNA 복제와 같은 크로마틴 기반 생물학적 과정에서 해당 단백질의 기계론적 역할을 밝힐 수 있습니다. 오늘날 단백질-DNA 상호 작용을 프로파일링하는 데 사용할 수 있는 기술을 통해 연구자들은 전례 없는 해상도로 조절을 탐구할 수 있습니다. 이러한 기술적 진보는 Henikoff 실험실의 CUT&RUN(Cleavage Under Targets and Release Using Nuclease) 개발을 포함한 새로운 염색질 프로파일링 기술의 도입을 통해 가능해졌습니다. CUT&RUN은 기존 크로마틴 면역침전(ChIP)에 비해 세포 입력 요구 사항이 낮고, 염기서열 분석 깊이 요구 사항이 낮으며, 항체 에피토프를 마스킹하는 가교 작용제의 부족으로 인한 배경 신호 감소로 감도가 높아지는 등 여러 가지 기술적 이점을 제공합니다. 염색질 조절을 연구하기 위해 이 기법을 채택하려면 기법의 기본 원리에 대한 철저한 이해와 CUT&RUN 데이터를 분석, 검증 및 해석하는 방법에 대한 이해가 필요합니다.
CUT&RUN 절차는 마그네틱 비드에 접합된 Concanavalin A에 세포를 결합하는 것으로 시작하여 절차 전반에 걸쳐 낮은 세포 수를 조작할 수 있습니다. 분리된 세포는 관심 단백질을 표적으로 하는 항체의 도입을 용이하게 하기 위해 중성 세제를 사용하여 투과화됩니다. 그런 다음 미세구균 뉴클레아제(MNase)를 효소에 연결된 단백질 A 또는 단백질 A/G 태그를 사용하여 결합된 항체에 모집합니다. 칼슘은 효소 활동을 시작하기 위해 도입됩니다. MNase 분해는 단일 뉴클레오솜 DNA-단백질 복합체를 생성합니다. 그런 다음 칼슘을 킬레이트화하여 분해 반응을 종료하고, MNase 분해에서 짧은 DNA 단편을 핵에서 방출한 다음 DNA 정제, 라이브러리 준비 및 고처리량 염기서열분석1 을 거칩니다(그림 1).
게놈 전반에 걸쳐 단백질 점유율을 매핑하고 정량화하는 인실리코(in silico) 접근법은 이러한 DNA-단백질 상호 작용을 강화하는 데 사용되는 습식 실험실 접근법과 병행하여 개발되었습니다. 풍부한 신호(피크) 영역을 식별하는 것은 생물정보학 분석에서 가장 중요한 단계 중 하나입니다. 초기 ChIP-seq 분석 방법은 MACS2 및 SICER3과 같은 알고리즘을 사용했으며, 이는 실제 단백질-DNA 결합 부위를 배경 잡음과 구별하기 위해 통계 모델을 사용했습니다. 그러나 CUT&RUN 데이터의 낮은 배경 노이즈와 높은 해상도로 인해 ChIP-seq 분석에 사용되는 일부 피크 호출 프로그램은 CUT&RUN 분석4에 적합하지 않습니다. 이 과제는 CUT&RUN 데이터 분석에 더 적합한 새로운 도구의 필요성을 강조합니다. SEACR4는 ChIP-seq 분석에 일반적으로 사용되는 도구와 관련된 제한 사항을 극복하면서 CUT&RUN 데이터에서 피크 호출을 가능하게 하기 위해 최근에 개발된 도구 중 하나입니다.
CUT&RUN 염기서열분석 데이터의 생물학적 해석은 분석 파이프라인의 피크 호출 다운스트림 출력에서 도출됩니다. CUT&RUN 데이터에서 호출된 피크의 잠재적인 생물학적 관련성을 예측하기 위해 여러 기능 주석 프로그램을 구현할 수 있습니다. 예를 들어, 유전자 온톨로지(Gene Ontology, GO) 프로젝트는 관심 유전자 5,6,7에 대한 잘 정립된 기능적 식별을 제공한다. 다양한 소프트웨어 도구 및 리소스를 통해 GO 분석을 용이하게 하여 CUT&RUN 피크 8,9,10,11,12,13,14 사이에 풍부한 유전자 및 유전자 세트를 밝힐 수 있습니다. 또한 Deeptools15, IGV(Integrative genomics viewer)16 및 UCSC GenomeBrowser 17과 같은 시각화 소프트웨어를 사용하면 게놈 전체의 관심 영역에서 신호 분포 및 패턴을 시각화할 수 있습니다.
CUT&RUN 데이터에서 생물학적 해석을 도출할 수 있는 능력은 데이터 품질의 검증에 크게 좌우됩니다. 검증해야 할 중요한 구성 요소에는 i) CUT&RUN 라이브러리 염기서열분석 품질, ii) 복제 유사성, iii) 피크 중심에서의 신호 분포 평가가 포함됩니다. 세 가지 구성 요소 모두의 검증을 완료하는 것은 CUT&RUN 라이브러리 샘플 및 다운스트림 분석 결과의 신뢰성을 보장하는 데 매우 중요합니다. 따라서 생물정보학 초보자 및 습식 실험실 연구원이 표준 CUT&RUN 분석 파이프라인의 일부로 이러한 검증 단계를 수행할 수 있도록 입문용 CUT&RUN 분석 가이드를 수립하는 것이 중요합니다.
습식 실험실 CUT&RUN 실험의 개발과 함께 CUT&RUNTools 2.018,19, nf-core/cutandrun20 및 CnRAP21과 같은 다양한 인실리코 CUT&RUN 분석 파이프라인이 개발되어 CUT&RUN 데이터 분석을 지원합니다. 이러한 도구는 단일 셀 및 대량 CUT&RUN 및 CUT&Tag 데이터 세트를 분석하는 강력한 접근 방식을 제공합니다. 그러나 상대적으로 복잡한 모듈식 프로그램 구조와 이러한 분석 파이프라인을 수행하기 위해 여러 프로그래밍 언어에 대한 친숙함이 필요하기 때문에 CUT&RUN 분석 단계를 철저히 이해하고 자체 파이프라인을 사용자 정의하려는 생물정보학 초보자의 채택을 방해할 수 있습니다. 이 장벽을 우회하려면 간단한 단일 프로그래밍 언어를 사용하여 인코딩된 간단한 단계별 스크립트로 제공되는 새로운 입문용 CUT&RUN 분석 파이프라인이 필요합니다.
이 기사에서는 신규 및 초보 사용자가 CUT&RUN 염기서열분석 분석을 수행할 수 있도록 자세한 설명과 함께 지원되는 단계별 스크립트를 제공하는 간단한 단일 언어 CUT&RUN 분석 파이프라인 프로토콜에 대해 설명합니다. 이 파이프라인에 사용된 프로그램은 원래 개발자 그룹에서 공개적으로 사용할 수 있습니다. 이 프로토콜에 설명된 주요 단계에는 판독 정렬, 피크 호출, 기능 분석, 그리고 가장 중요하게는 생물학적 해석에 대한 데이터 적합성과 신뢰성을 결정하기 위해 시료 품질을 평가하는 검증 단계가 포함됩니다(그림 2). 또한 이 파이프라인은 사용자에게 공개적으로 사용 가능한 CUT&RUN 데이터 세트와 비교하여 분석 결과를 상호 참조할 수 있는 기회를 제공합니다. 궁극적으로 이 CUT&RUN 분석 파이프라인 프로토콜은 생물정보학 분석 초보자와 습식 실험실 연구원을 위한 입문 가이드 및 참조 역할을 합니다.
참고: CUT&RUN fastq 파일에 대한 정보 files GSE126612 표 1에서 확인할 수 있습니다. 이 연구에 사용된 소프트웨어 응용 프로그램과 관련된 정보는 자료 표에 나열되어 있습니다.
1. Github 페이지에서 Easy-Shells_CUTnRUN 파이프라인 다운로드
2. Easy Shells CUTnRUN에 필요한 프로그램 설치
3. SRA(Sequence Read Archive)에서 공개적으로 사용 가능한 CUT&RUN 데이터 세트 다운로드
4. raw sequencing 파일에 대한 초기 품질 검사
5. 원시 염기서열분석 파일에 대한 품질 및 어댑터 트리밍
6. 실제 및 스파이크인 대조군 샘플에 대한 참조 게놈에 대한 bowtie2 인덱스 다운로드
7. 트리밍된 CUT&RUN 염기서열분석 판독을 참조 게놈에 매핑
8. 매핑된 읽기 쌍 파일 정렬 및 필터링
9. 매핑된 읽기 쌍을 단편 BEDPE, BED 및 원시 readcounts bedGraph 파일로 변환
10. 원시 readcounts bedGraph 파일을 정규화된 bedGraph 및 bigWig 파일로 변환
11. 프래그먼트 크기 분포 검증
12. MACS2, MACS3 및 SEACR을 사용하여 피크 호출
13. 피크 베드 파일이라는 파일 만들기
14. Pearson 상관 관계와 주성분(PC) 분석을 사용하여 반복실험 간의 유사성을 검증합니다.
15. Venn 다이어그램을 사용하여 반복실험, 피크 호출 방법 및 옵션 간의 유사성 검증
16. 히트맵과 평균 플롯을 분석하여 호출된 피크를 시각화합니다.
Quality and adapter trimming은 높은 sequencing 품질로 판독을 유지합니다.
High-throughput sequencing 기법은 read에서 염기서열 'mutations'와 같은 염기서열분석 오류를 발생시키기 쉽습니다. 또한, 시퀀싱 어댑터 이량체는 라이브러리 준비 중 어댑터 제거가 불량하기 때문에 시퀀싱 데이터 세트에서 강화될 수 있습니다. 판독 돌연변이, 적절한 매핑에 필요한 것보다 짧은 판...
염색질에 대한 단백질 점유율을 매핑하는 능력은 염색질 생물학 분야에서 기계론적 연구를 수행하는 데 기본입니다. 실험실에서 크로마틴을 프로파일링하기 위해 새로운 습식 실험실 기술을 채택함에 따라 이러한 습식 실험실 실험의 염기서열 분석 데이터를 분석하는 능력은 습식 실험실 과학자들에게 일반적인 병목 현상이 되고 있습니다. 따라서 생물정보학 초보자가...
저자는 공개하지 않음을 선언합니다.
모든 일러스트 피규어는 BioRender.com 로 만들어졌습니다. CAI는 난소암 연구 연합(Ovarian Cancer Research Alliance)의 조기 경력 연구자상(Early Career Investigator Award), 포벡 재단 액셀러레이터 보조금(Forbeck Foundation Accelerator Grant), 미네소타 난소암 연합(Minnestoa Ovarian Cancer Alliance)의 국가 조기 발견 연구상(National Early Detection Research Award)을 통해 제공된 지원을 인정합니다.
Name | Company | Catalog Number | Comments |
bedGraphToBigWig | ENCODE | https://hgdownload.soe.ucsc.edu/admin/exe/ | Software to compress and convert readcounts bedGraph to bigWig |
bedtools-2.31.1 | The Quinlan Lab @ the U. of Utah | https://bedtools.readthedocs.io/en/latest/index.html | Software to process bam/bed/bedGraph files |
bowtie2 2.5.4 | Johns Hopkins University | https://bowtie-bio.sourceforge.net/bowtie2/index.shtml | Software to build bowtie index and perform alignment |
CollectInsertSizeMetrics (Picard) | Broad institute | https://github.com/broadinstitute/picard | Software to perform insert size distribution analysis |
Cutadapt | NBIS | https://cutadapt.readthedocs.io/en/stable/index.html | Software to perform adapter trimming |
Deeptoolsv3.5.1 | Max Planck Institute | https://deeptools.readthedocs.io/en/develop/index.html | Software to perform Pearson coefficient correlation analysis, Principal component analysis, and Heatmap/average plot analysis |
FastQC Version 0.12.0 | Babraham Bioinformatics | https://github.com/s-andrews/FastQC | Software to check quality of fastq file |
Intervenev0.6.1 | Computational Biology & Gene regulation - Mathelier group | https://intervene.readthedocs.io/en/latest/index.html | Software to perform venn diagram analysis using peak files |
MACSv2.2.9.1 | Chan Zuckerberg initiative | https://github.com/macs3-project/MACS/tree/macs_v2 | Software to call peaks |
MACSv3.0.2 | Chan Zuckerberg initiative | https://github.com/macs3-project/MACS/tree/master | Software to call peaks |
Samtools-1.21 | Wellcome Sanger Institute | https://github.com/samtools/samtools | Software to process sam/bam files |
SEACRv1.3 | Howard Hughes Medial institute | https://github.com/FredHutch/SEACR | Software to call peaks |
SRA Toolkit Release 3.1.1 | NCBI | https://github.com/ncbi/sra-tools | Software to download SRR from GEO |
Trim_Galore v0.6.10 | Babraham Bioinformatics | https://github.com/FelixKrueger/TrimGalore | Software to perform quality and atapter trimming |
JoVE'article의 텍스트 или 그림을 다시 사용하시려면 허가 살펴보기
허가 살펴보기This article has been published
Video Coming Soon
Copyright © 2025 MyJoVE Corporation. 판권 소유