JoVE 비디오를 활용하시려면 도서관을 통한 기관 구독이 필요합니다. 전체 비디오를 보시려면 로그인하거나 무료 트라이얼을 시작하세요.
여기에 제출된 프로토콜은 숙주-병원체 상호작용을 연구하는 RNA 시퀀싱 전사체 데이터에서 circRNA를 예측하고 기능적으로 특성화하는 데 필요한 완전한 인실리코 파이프라인을 설명합니다.
원형 RNA(circRNA)는 역접합을 통해 형성되는 비암호화 RNA의 한 부류입니다. 이러한 circRNA는 다양한 생물학적 과정의 조절자로서의 역할에 대해 주로 연구됩니다. 특히, 새로운 증거는 숙주 circRNA가 병원체(예: 인플루엔자 및 코로나바이러스)에 감염될 때 차등적으로 발현(DE)될 수 있음을 보여주며, 이는 숙주 선천성 면역 반응을 조절하는 circRNA의 역할을 시사합니다. 그러나 병원성 감염 동안 circRNA의 역할에 대한 조사는 RNA 시퀀싱(RNA-seq) 데이터에서 DE circRNA를 식별하는 데 필요한 생물정보학적 분석을 수행하는 데 필요한 지식과 기술에 의해 제한됩니다. circRNA의 생물정보학 예측 및 식별은 검증에 앞서 중요하며, 비용과 시간이 많이 소요되는 습식 실험실 기술을 사용한 기능 연구도 중요합니다. 이 문제를 해결하기 위해 RNA-seq 데이터를 사용하여 circRNA의 in silico 예측 및 특성화에 대한 단계별 프로토콜이 이 원고에 제공됩니다. 프로토콜은 4 단계로 나눌 수 있습니다 : 1) CIRIquant 파이프 라인을 통한 DE circRNA의 예측 및 정량화; 2) circBase를 통한 주석 및 DE circRNA의 특성화; 3) Circr 파이프라인을 통한 CircRNA-miRNA 상호작용 예측; 4) 유전자 온톨로지(Gene Ontology, GO)와 교토 유전자 및 게놈 백과사전(Kyoto Encyclopedia of Genes and Genomes, KEGG)을 이용한 circRNA 모유전자의 기능적 농축 분석. 이 파이프라인은 숙주-병원체 상호작용에서 circRNA의 역할을 더욱 밝히기 위해 미래의 시험관 내 및 생체 내 연구를 추진하는 데 유용할 것입니다.
숙주-병원체 상호작용은 병원체와 숙주 유기체 사이의 복잡한 상호작용을 나타내며, 이는 숙주의 선천적 면역 반응을 유발하여 결국 침입하는 병원체를 제거한다 1,2. 병원성 감염 동안, 다수의 숙주 면역 유전자는 병원체의 복제 및 방출을 억제하도록 조절된다. 예를 들어, 병원성 감염에 따라 조절되는 일반적인 인터페론 자극 유전자 (ISG)는 ADAR1, IFIT1, IFIT2, IFIT3, ISG20, RIG-I 및 OASL 3,4를 포함한다. 단백질 코딩 유전자 외에도, 연구에서는 긴 비암호화 RNA(lncRNA), 마이크로 RNA(miRNA) 및 원형 RNA(circRNA)와 같은 비암호화 RNA도 병원성 감염동안 역할을 하고 동시에 조절된다고 보고했습니다 5,6,7. 단백질을 기능적 분자로 주로 암호화하는 단백질 코딩 유전자와 달리, 비암호화 RNA(ncRNA)는 전사 및 전사 후 수준에서 유전자의 조절자로서 기능하는 것으로 알려져 있습니다. 그러나 숙주의 면역 유전자를 조절하는 데 비암호화 RNA, 특히 circRNA의 참여와 관련된 연구는 단백질 코딩 유전자에 비해 잘 보고되지 않았습니다.
CircRNA는 백스플라이싱(back-splicing)이라고 하는 비정준 스플라이싱 프로세스를 통해 생성되는 공유 폐쇄 연속 루프 구조를 특징으로 한다8. 동족 선형 RNA의 스플라이싱 과정과 달리 역접합 과정은 다운스트림 기증자 부위를 업스트림 수용체 부위로 결찰하여 원형 구조를 형성하는 과정을 포함합니다. 현재, circRNA의 생물 발생을 위한 세 가지 다른 역접합 메커니즘이 제안되었습니다. 이들은 RNA 결합 단백질(RBP) 매개 순환화(intron-pairing-driven circularization) 9,10, 인트론-페어링-유도 순환화(intron-pairing-driven circularization) 11 및 라리아트-유도 순환화(lariat-driven circularization)12,13,14이다. circRNA가 원형 구조에서 종단 간 연결되어 있다는 점을 감안할 때, 이들은 정상적인 엑소뉴클레아제 소화에 자연적으로 내성을 갖는 경향이 있으며, 따라서 선형 대응물보다 더 안정적인 것으로 간주됩니다15. circRNAs에 의해 나타나는 또 다른 공통적인 특징은 숙주에서의 세포 또는 조직 유형-특이적 발현을 포함한다16.
독특한 구조와 세포 또는 조직 특이적 발현에서 알 수 있듯이 circRNA는 세포에서 중요한 생물학적 기능을 수행하는 것으로 밝혀졌습니다. 현재까지, circRNAs의 두드러진 기능 중 하나는 microRNA (miRNA) 스폰지로서의 역할이다17,18. circRNA의 이러한 조절 역할은 circRNA 뉴클레오티드와 miRNA의 종자 영역의 상보적 결합을 통해 발생합니다. 이러한 circRNA-miRNA 상호작용은 표적 mRNA에 대한 miRNA의 정상적인 조절 기능을 억제하여 유전자19,20의 발현을 조절합니다. 또한, circRNA는 RNA 결합 단백질(RBP)과 상호작용하고 RNA-단백질 복합체를 형성함으로써 유전자 발현을 조절하는 것으로도 알려져 있다21. circRNA는 비암호화 RNA로 분류되지만 circRNA가 단백질 번역을 위한 주형으로 작용할 수 있다는 증거도 있습니다22,23,24.
최근에, circRNA는 숙주-병원체 상호작용, 특히 숙주와 바이러스 사이의 상호작용을 조절하는 데 중추적인 역할을 하는 것으로 입증되었습니다. 일반적으로 숙주 circRNA는 침입하는 병원체를 제거하기 위해 숙주의 면역 반응을 조절하는 데 도움이 되는 것으로 가정합니다. 숙주 면역 반응을 촉진하는 circRNA의 예는 Guo et al.25에 의해 보고된 circRNA_0082633입니다. 이 circRNA는 A549 세포 내에서 I형 인터페론(IFN) 신호 전달을 향상시켜 인플루엔자 바이러스 복제를 억제하는 데 도움이 된다25. 또한, Qu et al. IFN-β26,27의 신호 변환기인 CREB 결합 단백질(CREBBP)의 발현을 조절하여 면역을 촉진하는 circRNA AIVR이라고 하는 인간 인트로닉 circRNA도 보고했습니다. 그러나, 감염 시 질병의 발병기전을 촉진하는 것으로 알려진 circRNA도 존재한다. 예를 들어, Yu 등은 최근 숙주 세포 자가포식의 억제를 통해 H1N1 바이러스 복제를 촉진하는 데 있어 2A 유전자(circGATAD2A)를 포함하는 GATA 징크 핑거 도메인에서 스플라이싱된 circRNA가 수행하는 역할을 보고했습니다(28).
circRNA를 효과적으로 연구하기 위해 일반적으로 게놈 차원의 circRNA 예측 알고리즘이 구현된 후 기능적 연구를 수행하기 전에 예측된 circRNA 후보의 인실리코 특성화가 수행됩니다. circRNA를 예측하고 특성화하기 위한 이러한 생물정보학 접근 방식은 비용이 적게 들고 시간 효율적입니다. 기능적으로 연구할 후보의 수를 구체화하는 데 도움이 되며 잠재적으로 새로운 발견으로 이어질 수 있습니다. 여기에서 우리는 숙주-병원체 상호 작용 동안 circRNA의 in silico 식별, 특성화 및 기능적 주석을 위한 상세한 생물정보학 기반 프로토콜을 제공합니다. 이 프로토콜에는 RNA 염기서열 분석 데이터 세트에서 circRNA의 식별 및 정량화, circBase를 통한 주석, circRNA 유형, 겹치는 유전자 수 및 예측된 circRNA-miRNA 상호 작용 측면에서 circRNA 후보의 특성화가 포함됩니다. 본 연구는 또한 유전자 온톨로지(Gene Ontology, GO)와 교토 유전자 및 게놈 백과사전(Kyoto Encyclopedia of Genes and Genomes, KEGG) 농축 분석을 통해 circRNA 부모 유전자의 기능적 주석을 제공한다.
이 프로토콜에서는 인플루엔자 A 바이러스에 감염된 인간 대식세포에서 제조된 비식별화된 리보솜 RNA(rRNA)가 고갈된 RNA-seq 라이브러리 데이터 세트를 다운로드하여 유전자 발현 옴니버스(GEO) 데이터베이스에서 사용했습니다. circRNA의 예측에서 기능적 특성화에 이르는 전체 생물정보학 파이프라인은 그림 1에 요약되어 있습니다. 파이프라인의 각 부분은 아래 섹션에 자세히 설명되어 있습니다.
1. 데이터 분석 전 준비, 다운로드 및 설정
참고: 이 연구에 사용된 모든 소프트웨어 패키지는 무료이며 오픈 소스입니다.
2. CIRIquant를 이용한 circRNA의 예측 및 차등 발현 분석
참고: 차등 발현 분석의 설치 및 수행에 대한 자세한 설명서는 CIRIquant 논문31의 코드 가용성 섹션에서 찾을 수 있습니다. 보충 데이터에는 이 프로토콜에서 사용되는 기본 명령 중 일부도 포함되어 있습니다.
3. 예측된 DE circRNA의 특성화 및 주석
4. Circr을 이용한 circRNA-miRNA 상호작용 예측
참고: circRNA-miRNA 상호작용 분석을 위해 circr을 설치하고 사용하는 방법에 대한 자세한 설명서는 https://github.com/bicciatolab/Circr37에서 찾을 수 있습니다.
5. ceRNA 네트워크 구축
참고 : Cytoscape 사용 방법에 대한 자세한 설명서는 http://manual.cytoscape.org/en/stable/ 및 https://github.com/cytoscape/cytoscape-tutorials/wiki#introduction 에서 찾을 수 있습니다.
6. 기능적 농축 분석
이전 섹션에서 입대한 프로토콜은 Linux OS 시스템에 맞게 수정 및 구성되었습니다. 주된 이유는 circRNA 분석과 관련된 대부분의 모듈 라이브러리와 패키지가 Linux 플랫폼에서만 작동할 수 있기 때문입니다. 이 분석에서, 인플루엔자 A 바이러스에 감염된 인간 대식세포로부터 제조된 비식별화된 리보솜 RNA(rRNA)-고갈된 RNA-seq 라이브러리 데이터 세트를 GEO 데이터베이스(42 )로부터 다?...
이 프로토콜의 유용성을 설명하기 위해, 인플루엔자 A 바이러스에 감염된 인간 대식세포로부터의 RNA-seq를 예로서 사용하였다. 숙주-병원체 상호작용에서 잠재적인 miRNA 스폰지로 기능하는 CircRNA와 숙주 내에서 GO 및 KEGG 기능적 농축을 조사했습니다. 온라인에서 사용할 수 있는 다양한 circRNA 도구가 있지만 각 도구는 서로 상호 작용하지 않는 독립형 패키지입니다. 여기에서는 circRNA 예측 및 정량화...
저자는 공개 할 것이 없습니다.
저자는 이 원고에 대한 비판적 검토에 대해 Tan Ke En과 Dr. Cameron Bracken에게 감사를 표합니다. 이 작업은 기초 연구 보조금 제도(FRGS/1/2020/SKK0/UM/02/15) 및 말라야 대학교 임팩트 연구 보조금(UM. C/625/1/HIR/MOE/CHAN/02/07)입니다.
Name | Company | Catalog Number | Comments |
Bedtools | GitHub | https://github.com/arq5x/bedtools2/ | Referring to section 4.1.2. Needed for Circr. |
BWA | Burrows-Wheeler Aligner | http://bio-bwa.sourceforge.net/ | Referring to section 2.1.1 and 2.1.2. Needed to run CIRIquant, and to index the genome |
Circr | GitHub | https://github.com/bicciatolab/Circr | Referring to section 4. Use to predict the miRNA binding sites |
CIRIquant | GitHub | https://github.com/bioinfo-biols/CIRIquant | Referring to section 2.1.3. To predict circRNAs |
Clusterprofiler | GitHub | https://github.com/YuLab-SMU/clusterProfiler | Referring to section 7. For GO and KEGG functional enrichment |
CPU | Intel | Intel(R) Xeon(R) CPU E5-2620 V2 @ 2.10 GHz Cores: 6-core CPU Memory: 65 GB Graphics card: NVIDIA GK107GL (QUADRO K2000) | Specifications used to run this entire protocol. |
Cytoscape | Cytoscape | https://cytoscape.org/download.html | Referring to section 5.2. Needed to plot ceRNA network |
FastQC | Babraham Bioinformatics | https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ | Referring to section 1.2.1. Quality checking on Fastq files |
HISAT2 | http://daehwankimlab.github.io/hisat2/ | Referring to section 2.1.1 and 2.1.2. Needed to run CIRIquant, and to index the genome | |
Linux | Ubuntu 20.04.5 LTS (Focal Fossa) | https://releases.ubuntu.com/focal/ | Needed to run the entire protocol. Other Ubuntu versions may still be valid to carry out the protocol. |
miRanda | http://www.microrna.org/microrna/getDownloads.do | Referring to section 4.1.2. Needed for Circr | |
Pybedtools | pybedtools 0.8.2 | https://pypi.org/project/pybedtools/ | Needed for BED file genomic manipulation |
Python | Python 2.7 and 3.6 or abover | https://www.python.org/downloads/ | To run necessary library modules |
R | The Comprehensive R Archive Network | https://cran.r-project.org/ | To manipulate dataframes |
RNAhybrid | BiBiServ | https://bibiserv.cebitec.uni-bielefeld.de/rnahybrid | Referring to section 4.1.2. Needed for Circr |
RStudio | RStudio | https://www.rstudio.com/ | A workspace to run R |
samtools | SAMtools | http://www.htslib.org/ | Referring to section 2.1.2. Needed to run CIRIquant |
StringTie | Johns Hopkins University: Center for Computational Biology | http://ccb.jhu.edu/software/stringtie/index.shtml | Referring to section 2.1.2. Needed to run CIRIquant |
TargetScan | GitHub | https://github.com/nsoranzo/targetscan | Referring to section 4.1.2. Needed for Circr |
JoVE'article의 텍스트 или 그림을 다시 사용하시려면 허가 살펴보기
허가 살펴보기This article has been published
Video Coming Soon
Copyright © 2025 MyJoVE Corporation. 판권 소유