로그인

JoVE 비디오를 활용하시려면 도서관을 통한 기관 구독이 필요합니다. 전체 비디오를 보시려면 로그인하거나 무료 트라이얼을 시작하세요.

기사 소개

  • 요약
  • 초록
  • 서문
  • 프로토콜
  • 결과
  • 토론
  • 공개
  • 감사의 말
  • 자료
  • 참고문헌
  • 재인쇄 및 허가

요약

여기에 제출된 프로토콜은 숙주-병원체 상호작용을 연구하는 RNA 시퀀싱 전사체 데이터에서 circRNA를 예측하고 기능적으로 특성화하는 데 필요한 완전한 인실리코 파이프라인을 설명합니다.

초록

원형 RNA(circRNA)는 역접합을 통해 형성되는 비암호화 RNA의 한 부류입니다. 이러한 circRNA는 다양한 생물학적 과정의 조절자로서의 역할에 대해 주로 연구됩니다. 특히, 새로운 증거는 숙주 circRNA가 병원체(예: 인플루엔자 및 코로나바이러스)에 감염될 때 차등적으로 발현(DE)될 수 있음을 보여주며, 이는 숙주 선천성 면역 반응을 조절하는 circRNA의 역할을 시사합니다. 그러나 병원성 감염 동안 circRNA의 역할에 대한 조사는 RNA 시퀀싱(RNA-seq) 데이터에서 DE circRNA를 식별하는 데 필요한 생물정보학적 분석을 수행하는 데 필요한 지식과 기술에 의해 제한됩니다. circRNA의 생물정보학 예측 및 식별은 검증에 앞서 중요하며, 비용과 시간이 많이 소요되는 습식 실험실 기술을 사용한 기능 연구도 중요합니다. 이 문제를 해결하기 위해 RNA-seq 데이터를 사용하여 circRNA의 in silico 예측 및 특성화에 대한 단계별 프로토콜이 이 원고에 제공됩니다. 프로토콜은 4 단계로 나눌 수 있습니다 : 1) CIRIquant 파이프 라인을 통한 DE circRNA의 예측 및 정량화; 2) circBase를 통한 주석 및 DE circRNA의 특성화; 3) Circr 파이프라인을 통한 CircRNA-miRNA 상호작용 예측; 4) 유전자 온톨로지(Gene Ontology, GO)와 교토 유전자 및 게놈 백과사전(Kyoto Encyclopedia of Genes and Genomes, KEGG)을 이용한 circRNA 모유전자의 기능적 농축 분석. 이 파이프라인은 숙주-병원체 상호작용에서 circRNA의 역할을 더욱 밝히기 위해 미래의 시험관 내 및 생체 내 연구를 추진하는 데 유용할 것입니다.

서문

숙주-병원체 상호작용은 병원체와 숙주 유기체 사이의 복잡한 상호작용을 나타내며, 이는 숙주의 선천적 면역 반응을 유발하여 결국 침입하는 병원체를 제거한다 1,2. 병원성 감염 동안, 다수의 숙주 면역 유전자는 병원체의 복제 및 방출을 억제하도록 조절된다. 예를 들어, 병원성 감염에 따라 조절되는 일반적인 인터페론 자극 유전자 (ISG)는 ADAR1, IFIT1, IFIT2, IFIT3, ISG20, RIG-I 및 OASL 3,4를 포함한다. 단백질 코딩 유전자 외에도, 연구에서는 긴 비암호화 RNA(lncRNA), 마이크로 RNA(miRNA) 및 원형 RNA(circRNA)와 같은 비암호화 RNA도 병원성 감염동안 역할을 하고 동시에 조절된다고 보고했습니다 5,6,7. 단백질을 기능적 분자로 주로 암호화하는 단백질 코딩 유전자와 달리, 비암호화 RNA(ncRNA)는 전사 및 전사 후 수준에서 유전자의 조절자로서 기능하는 것으로 알려져 있습니다. 그러나 숙주의 면역 유전자를 조절하는 데 비암호화 RNA, 특히 circRNA의 참여와 관련된 연구는 단백질 코딩 유전자에 비해 잘 보고되지 않았습니다.

CircRNA는 백스플라이싱(back-splicing)이라고 하는 비정준 스플라이싱 프로세스를 통해 생성되는 공유 폐쇄 연속 루프 구조를 특징으로 한다8. 동족 선형 RNA의 스플라이싱 과정과 달리 역접합 과정은 다운스트림 기증자 부위를 업스트림 수용체 부위로 결찰하여 원형 구조를 형성하는 과정을 포함합니다. 현재, circRNA의 생물 발생을 위한 세 가지 다른 역접합 메커니즘이 제안되었습니다. 이들은 RNA 결합 단백질(RBP) 매개 순환화(intron-pairing-driven circularization) 9,10, 인트론-페어링-유도 순환화(intron-pairing-driven circularization) 11 및 라리아트-유도 순환화(lariat-driven circularization)12,13,14이다. circRNA가 원형 구조에서 종단 간 연결되어 있다는 점을 감안할 때, 이들은 정상적인 엑소뉴클레아제 소화에 자연적으로 내성을 갖는 경향이 있으며, 따라서 선형 대응물보다 더 안정적인 것으로 간주됩니다15. circRNAs에 의해 나타나는 또 다른 공통적인 특징은 숙주에서의 세포 또는 조직 유형-특이적 발현을 포함한다16.

독특한 구조와 세포 또는 조직 특이적 발현에서 알 수 있듯이 circRNA는 세포에서 중요한 생물학적 기능을 수행하는 것으로 밝혀졌습니다. 현재까지, circRNAs의 두드러진 기능 중 하나는 microRNA (miRNA) 스폰지로서의 역할이다17,18. circRNA의 이러한 조절 역할은 circRNA 뉴클레오티드와 miRNA의 종자 영역의 상보적 결합을 통해 발생합니다. 이러한 circRNA-miRNA 상호작용은 표적 mRNA에 대한 miRNA의 정상적인 조절 기능을 억제하여 유전자19,20의 발현을 조절합니다. 또한, circRNA는 RNA 결합 단백질(RBP)과 상호작용하고 RNA-단백질 복합체를 형성함으로써 유전자 발현을 조절하는 것으로도 알려져 있다21. circRNA는 비암호화 RNA로 분류되지만 circRNA가 단백질 번역을 위한 주형으로 작용할 수 있다는 증거도 있습니다22,23,24.

최근에, circRNA는 숙주-병원체 상호작용, 특히 숙주와 바이러스 사이의 상호작용을 조절하는 데 중추적인 역할을 하는 것으로 입증되었습니다. 일반적으로 숙주 circRNA는 침입하는 병원체를 제거하기 위해 숙주의 면역 반응을 조절하는 데 도움이 되는 것으로 가정합니다. 숙주 면역 반응을 촉진하는 circRNA의 예는 Guo et al.25에 의해 보고된 circRNA_0082633입니다. 이 circRNA는 A549 세포 내에서 I형 인터페론(IFN) 신호 전달을 향상시켜 인플루엔자 바이러스 복제를 억제하는 데 도움이 된다25. 또한, Qu et al. IFN-β26,27의 신호 변환기인 CREB 결합 단백질(CREBBP)의 발현을 조절하여 면역을 촉진하는 circRNA AIVR이라고 하는 인간 인트로닉 circRNA도 보고했습니다. 그러나, 감염 시 질병의 발병기전을 촉진하는 것으로 알려진 circRNA도 존재한다. 예를 들어, Yu 등은 최근 숙주 세포 자가포식의 억제를 통해 H1N1 바이러스 복제를 촉진하는 데 있어 2A 유전자(circGATAD2A)를 포함하는 GATA 징크 핑거 도메인에서 스플라이싱된 circRNA가 수행하는 역할을 보고했습니다(28).

circRNA를 효과적으로 연구하기 위해 일반적으로 게놈 차원의 circRNA 예측 알고리즘이 구현된 후 기능적 연구를 수행하기 전에 예측된 circRNA 후보의 인실리코 특성화가 수행됩니다. circRNA를 예측하고 특성화하기 위한 이러한 생물정보학 접근 방식은 비용이 적게 들고 시간 효율적입니다. 기능적으로 연구할 후보의 수를 구체화하는 데 도움이 되며 잠재적으로 새로운 발견으로 이어질 수 있습니다. 여기에서 우리는 숙주-병원체 상호 작용 동안 circRNA의 in silico 식별, 특성화 및 기능적 주석을 위한 상세한 생물정보학 기반 프로토콜을 제공합니다. 이 프로토콜에는 RNA 염기서열 분석 데이터 세트에서 circRNA의 식별 및 정량화, circBase를 통한 주석, circRNA 유형, 겹치는 유전자 수 및 예측된 circRNA-miRNA 상호 작용 측면에서 circRNA 후보의 특성화가 포함됩니다. 본 연구는 또한 유전자 온톨로지(Gene Ontology, GO)와 교토 유전자 및 게놈 백과사전(Kyoto Encyclopedia of Genes and Genomes, KEGG) 농축 분석을 통해 circRNA 부모 유전자의 기능적 주석을 제공한다.

프로토콜

이 프로토콜에서는 인플루엔자 A 바이러스에 감염된 인간 대식세포에서 제조된 비식별화된 리보솜 RNA(rRNA)가 고갈된 RNA-seq 라이브러리 데이터 세트를 다운로드하여 유전자 발현 옴니버스(GEO) 데이터베이스에서 사용했습니다. circRNA의 예측에서 기능적 특성화에 이르는 전체 생물정보학 파이프라인은 그림 1에 요약되어 있습니다. 파이프라인의 각 부분은 아래 섹션에 자세히 설명되어 있습니다.

1. 데이터 분석 전 준비, 다운로드 및 설정

참고: 이 연구에 사용된 모든 소프트웨어 패키지는 무료이며 오픈 소스입니다.

  1. Linux 플랫폼에서 필요한 도구 다운로드
    1. 개발자가 제공한 지침에 따라 재료 에 나열된 필수 소프트웨어 및 도구를 Linux 고성능 컴퓨터에 다운로드하여 설치합니다.
      참고: 대부분의 도구 및 소프트웨어에는 도구 설치 및 사용에 대한 지침이 포함된 자체 온라인 GitHub 페이지 또는 설명서가 있습니다( 재료 표 참조).
    2. 염기서열 아카이브 웹사이트(예: European Nucleotides Archive 및 Gene Expression Omnibus)에서 circRNA 검출 및 분석을 위해 원하는 RNA-seq 데이터 세트를 다운로드하십시오.
    3. RNA-seq 데이터 세트가 준비된 호스트와 호환되는 참조 게놈(FASTA 형식) 및 주석 파일(GTF/GFF3 형식)을 다운로드합니다. 호스트 참조 게놈 및 주석 파일은 일반적으로 NCBI(National Center for Biotechnology Information), UCSC(University of California Santa Cruz) 및 Ensembl 웹사이트와 같은 온라인 게놈 브라우저에서 찾을 수 있습니다.
  2. RNA-seq의 품질 검사
    1. FASTQ 파일을 FASTQC 프로그램에 입력하여 RNA 서열의 품질을 결정합니다. FASTQ 파일의 품질이 낮거나(예: 29,30과 같은 도구를 사용하여 추가 트리밍이 필요할 수 있습니다.

2. CIRIquant를 이용한 circRNA의 예측 및 차등 발현 분석

참고: 차등 발현 분석의 설치 및 수행에 대한 자세한 설명서는 CIRIquant 논문31의 코드 가용성 섹션에서 찾을 수 있습니다. 보충 데이터에는 이 프로토콜에서 사용되는 기본 명령 중 일부도 포함되어 있습니다.

  1. CircRNA 예측
    1. BWA 및 HISAT2 정렬기를 사용하여 먼저 숙주의 참조 게놈을 인덱싱합니다. 그런 다음 Linux 터미널에서 호스트의 참조 게놈 디렉토리에서 bwa index 32 및 hisat2-build33 명령을 실행하여 인덱싱합니다.
    2. 그런 다음 파일 이름, 도구 경로(BWA, HISAT2, stringtie34, samtools35), 다운로드한 참조 파일 경로(호스트의 참조 게놈 FASTA 파일, 주석 파일) 및 2.1.1단계의 인덱스 파일 경로가 포함된 YML 구성 파일을 준비합니다.
    3. 기본 또는 수동 매개 변수를 사용하여 터미널에서 CIRIquant 도구를 실행합니다. 사용자는 CIRIquant 도구를 실행할 때 RNA-seq 데이터의 라이브러리 유형(가닥 또는 비가닥)을 지정할 수 있습니다.
      참고: RNA-seq 데이터의 라이브러리 유형은 사용된 라이브러리 준비 키트의 유형을 알면 결정할 수 있습니다. 라이브러리 준비 키트의 신원을 알 수 없는 경우 RSeQC36 이라는 RNA-seq 대조 생물정보학 패키지를 사용하여 RNA-seq 데이터의 가닥을 결정할 수 있습니다.
  2. 차등 발현 분석
    참고 : CIRIquant 패키지에는 prep_CIRIquant, prepDE.pyCIRI_DE_replicate가 포함됩니다. 따라서 이 세 가지 도구에 대한 추가 다운로드가 필요하지 않습니다.
    1. 다음을 포함하는 데이터 목록이 포함된 텍스트 파일(.lst)을 준비합니다.
      1st 열: 2.1.3단계에서 사용된 RNA-seq 데이터의 ID
      2nd열: CIRIquant에서 출력한 GTF 파일의 경로
      3번째 열 : RNA-seq 데이터의 그룹화, 대조군인지 치료군인지.
    2. 예를 들어, 아래의 표 1 을 참조하십시오.
      참고: 헤더는 참조용이므로 입력할 필요가 없습니다.
    3. Linux 터미널에서 2.2.1단계에서 준비한 텍스트 파일(.lst)을 입력으로 prep_CIRIquant 실행합니다. 실행하면 library_info.csv, circRNA_info.csv, circRNA_bsj.csvcircRNA_ratio.csv 파일 목록이 생성됩니다.
    4. RNA-seq ID와 해당 StringTie 출력 경로가 포함된 데이터 목록이 포함된 두 번째 텍스트 파일을 준비합니다. 파일 레이아웃은 그룹화 열이 없는 2.2.1단계의 텍스트 파일과 유사해야 합니다.
    5. 2.2.4단계에서 준비한 텍스트 파일을 입력으로 사용하여 prepDE.py 실행하여 유전자 계수 행렬 파일을 생성합니다.
    6. 2.2.3단계의 library_info.csvcircRNA_bsj.csv 파일과 2.2.5단계의 gene_count_matrix.csv 파일을 입력으로 사용하여 CIRI_DE_replicate 실행하여 최종 circRNA_de.tsv 파일을 출력합니다.
  3. DE circRNA의 필터링
    1. R(컴퓨터 터미널 또는 RStudio에서) 또는 스프레드시트 소프트웨어(예: Microsoft Excel)를 사용하여 2.2.6단계에서 생성된 circRNA_de.tsv 파일을 열어 차등 발현(DE) circRNA의 수를 필터링하고 확인합니다.
    2. 기준에 따라 DE circRNA를 필터링합니다. LogFC > |2| FDR< 0.05입니다.
    3. DE circRNA의 정보를 저장하기 위해 DE_circRNAs.txt 라는 파일을 만듭니다.

3. 예측된 DE circRNA의 특성화 및 주석

  1. DE circRNA의 주석 상태
    1. 2.3.3단계에서 필터링된 DE circRNA 목록으로 구성된 RStudio에서 DE_circRNAs.txt 라는 파일을 로드합니다. 게놈 위치(Chr, Start, End), 가닥 방향(+ 또는 -), 유전자 이름 및 circRNA 유형과 같은 기타 정보를 포함합니다. 진행하기 전에 1개의 염기쌍을 빼서 circRNA 게놈 시작 좌표를 CIRIquant에서 0부터 시작으로 변환합니다.
      참고: 위에서 언급한 기타 정보는 CIRIquant에서 출력한 GTF 파일(보충 파일 1)에서 얻을 수 있습니다.
    2. circRNA 데이터베이스(예: circBase)에 기탁된 circRNA의 게놈 위치가 포함된 라이브러리를 다운로드하여 예측된 DE circRNA의 주석 상태를 결정합니다.
      참고: 비교하기 전에 circRNA를 예측하는 데 사용되는 게놈 버전이 circRNA 데이터베이스 라이브러리와 동일한지 확인하십시오. 여기서 사용하는 circBase 데이터 파일은 Github (https://github.com/bicciatolab/Circr)37에서 제공하는 드라이브 폴더에서 자유롭게 사용할 수 있습니다.
    3. 3.1.1단계와 3.1.2단계의 파일이 모두 준비되면 추가 파일 1에 제공된 R 스크립트를 실행합니다. DE circRNA의 염색체 위치는 Annotated 또는 Unannotated 상태를 할당하기 전에 라이브러리에 쿼리됩니다.
  2. DE circRNA의 특성화
    1. R 및 기타 스프레드시트 소프트웨어를 사용하여 circRNA 유형(즉, 엑손, 인트론, 유전자 간 및 안티센스)에 따른 circRNA 수와 circRNA가 가로지르는 유전자 수(1 또는 >1)를 요약합니다(보충 파일 1).참고: CIRIquant는 4가지 유형의 circRNA(엑손, 인트론, 유전자 간 및 안티센스)만 검출할 수 있습니다. ElciRNA라고도 하는 엑손-인트론 circRNA는 CIRIquant에서 검출할 수 없습니다.

4. Circr을 이용한 circRNA-miRNA 상호작용 예측

참고: circRNA-miRNA 상호작용 분석을 위해 circr을 설치하고 사용하는 방법에 대한 자세한 설명서는 https://github.com/bicciatolab/Circr37에서 찾을 수 있습니다.

  1. 파일 준비
    1. "WinRar" 또는 "7-zip"과 같은 관련 소프트웨어를 사용하여 Circr GitHub 페이지에서 다운로드한 후 Circr.zip 파일의 내용을 압축을 풀고 압축을 풉니다.
    2. circRNA-miRNA 분석을 수행하기 전에 필수 소프트웨어 애플리케이션(miRanda, RNAhybrid, Pybedtools 및 samtools)을 설치합니다.
    3. 관심 있는 여러 유기체에 대한 참조 게놈 및 주석 파일, rRNA 좌표 파일, 검증된 miRNA 상호작용 파일 및 circBase circRNA 파일은 Github 페이지 (https://github.com/bicciatolab/Circr)37에서 Circr 작성자가 제공합니다. 드라이브 폴더에서 지원 파일을 클릭하면 관심 생물체의 폴더, miRNA 폴더, circBase 텍스트 파일을 선택하여 다운로드합니다.
    4. 4.1.3단계에서 필요한 파일을 다운로드한 후 4.1.1단계에서 언급한 디렉토리에 support_files 라는 새 디렉토리를 만듭니다. 그런 다음 압축을 풀고 support_files 디렉터리에 압축을 풉니다.
    5. samtools faidx 명령(보충 파일 1)을 사용하여 관심 유기체의 참조 게놈 파일을 인덱싱합니다.
    6. 표 2에 나타낸 바와 같이, 탭으로 구분된 BED 파일에서 관심 있는 DE circRNA의 좌표로 구성된 입력 파일을 준비한다.
      참고: CIRIquant에 의해 예측된 circRNA는 0부터 시작하지 않기 때문에 BED 형식으로 변환하기 전에 시작 좌표(3.1.1단계에서 언급한 대로)에서 1bp를 뺄 필요가 있습니다. 표 2 에 표시된 헤더는 참조용일 뿐이며 BED 파일에는 필요하지 않습니다.
    7. 이 시점에서 Circr 분석에 필요한 폴더 트리 구조가 그림 2와 같아야 합니다.
  2. 러닝 Circr.py
    1. Python 3을 사용하여 Circr.py 실행하고, 인수로 circRNA 입력 파일, 관심 유기체의 FASTA 게놈, 선택한 유기체의 게놈 버전, 스레드 수 및 명령줄의 출력 파일 이름을 지정합니다.
    2. 4.1.3단계에 나열된 드라이브 폴더에 관심 있는 유기체가 제공되지 않거나 사용자가 분석을 실행하기 위해 사용자 정의 파일 세트를 원하는 경우 Circr.py 실행할 때 이러한 파일의 위치를 지정하는 추가 명령을 포함해야 합니다.
    3. Circr 분석이 완료된 후 프로그램은 csv 형식의 circRNA-miRNA 상호 작용 파일을 출력합니다.
    4. circRNA-miRNA 상호작용 결과를 사용자별 선호도에 따라 필터링합니다. 이 연구에서는 아래 기준에 따라 Rstudio를 사용하여 예측을 필터링합니다.
      - 세 가지 소프트웨어 도구 모두에서 감지됨
      -Targetscan과 miRanda에서 보고한 두 개 이상의 결합 부위
      - "AGO" 또는 "validated" 열에서 식별됩니다.
      -시드 영역 상호 작용 없음 필터링
    5. 4.2.3단계에서 필터링된 조건을 전달하는 circRNA를 circRNA_miRNA.txt라는 새 텍스트 파일에 씁니다. 이러한 필터링은 예측된 교호작용의 신뢰도를 증가시킬 수 있다.

5. ceRNA 네트워크 구축

참고 : Cytoscape 사용 방법에 대한 자세한 설명서는 http://manual.cytoscape.org/en/stable/ 및 https://github.com/cytoscape/cytoscape-tutorials/wiki#introduction 에서 찾을 수 있습니다.

  1. 다운로드 및 준비
    1. https://cytoscape.org/download.html 에서 최신 버전의 Cytoscape38 을 다운로드합니다.
    2. 5.1.1단계에서 다운로드한 설치 프로그램 마법사를 실행하고 Cytoscape 소프트웨어의 파일 위치를 선택합니다.
    3. 관심 있는 circRNA와 표적 miRNA를 포함하는 탭으로 구분된 파일을 준비합니다. 첫 번째 열은 circRNA 이름으로 구성됩니다. 두 번째 열은 첫 번째 열의 RNA 유형을 지정합니다. 세 번째 열은 표적 miRNA입니다. 네 번째 열은 세 번째 열에서 RNA의 유형을 지정합니다. 파일의 예는 표 3에 나와 있습니다.
  2. ceRNA 네트워크 맵 구성
    1. 5.1.2단계에서 설치한 Cytoscape 소프트웨어를 엽니다.
    2. Cytoscape에서 파일(File) > 파일에서 네트워크 가져오기(Import > Network from File)로 이동합니다. 5.1.3단계에서 준비한 파일을 선택합니다.
    3. 새 탭에서 첫 번째 열과 두 번째 열을 "소스 노드" 및 "소스 노드 속성"으로 선택하고 세 번째 열과 네 번째 열을 각각 "대상 노드" 및 "대상 노드 속성"으로 선택합니다. 확인을 클릭하면 네트워크가 Cytoscape의 오른쪽 상단에 표시됩니다.
    4. 신경망의 비주얼 스타일을 변경하려면 Cytoscape 왼쪽에 있는 Style 버튼을 누릅니다.
    5. 채우기 색상의 오른쪽에 있는 화살표를 누릅니다. 열로 Type(유형)을 선택하고 매핑 유형으로 Discrete Mapping(이산 매핑)을 선택합니다. 그런 다음 각 RNA 유형에 대해 원하는 색상을 선택합니다.
    6. 색상을 변경한 후 셰이프로 이동하고 5.2.5단계에 따라 노드의 셰이 프를 변경합니다.

6. 기능적 농축 분석

  1. circRNA의 부모 유전자에 대한 유전자 온톨로지(GO) 및 교토 유전자 및 게놈 백과사전(KEGG) 분석
    1. clusterProfiler 39,40org. Hs.eg.db41개의 패키지가 Rstudio에 설치되었습니다. 조직입니다. Hs.eg.db41 패키지는 인간만을 위한 게놈 전체 주석 패키지입니다. 관심있는 유기체가 다른 종이라면 다음을 참조하십시오 : https://bioconductor.org/packages/release/BiocViews.html#OrgDb
    2. 2.3.1단계의 DE_circRNA 정보를 Rstudio 작업 영역으로 가져옵니다.
    3. 다음 단계에서 농축 분석을 위해 이 파일에 제공된 circRNA의 부모 유전자를 사용합니다. 그러나 사용자가 유전자 기호를 Entrez ID와 같은 다른 형식으로 변환하려는 경우 "bitr"과 같은 기능을 사용합니다.
    4. 유전자 ID를 입력으로 사용하여 기본 파라미터를 사용하여 clusterProfiler39,40 패키지 내의 enrichGO 함수를 사용하여 GO 농축 분석을 실행합니다.
    5. 유전자 ID를 입력으로 사용하여 기본 파라미터를 사용하여 clusterProfiler39,40 패키지 내의 enrichKEGG 함수를 사용하여 KEGG 농축 분석을 실행합니다.

결과

이전 섹션에서 입대한 프로토콜은 Linux OS 시스템에 맞게 수정 및 구성되었습니다. 주된 이유는 circRNA 분석과 관련된 대부분의 모듈 라이브러리와 패키지가 Linux 플랫폼에서만 작동할 수 있기 때문입니다. 이 분석에서, 인플루엔자 A 바이러스에 감염된 인간 대식세포로부터 제조된 비식별화된 리보솜 RNA(rRNA)-고갈된 RNA-seq 라이브러리 데이터 세트를 GEO 데이터베이스(42 )로부터 다?...

토론

이 프로토콜의 유용성을 설명하기 위해, 인플루엔자 A 바이러스에 감염된 인간 대식세포로부터의 RNA-seq를 예로서 사용하였다. 숙주-병원체 상호작용에서 잠재적인 miRNA 스폰지로 기능하는 CircRNA와 숙주 내에서 GO 및 KEGG 기능적 농축을 조사했습니다. 온라인에서 사용할 수 있는 다양한 circRNA 도구가 있지만 각 도구는 서로 상호 작용하지 않는 독립형 패키지입니다. 여기에서는 circRNA 예측 및 정량화...

공개

저자는 공개 할 것이 없습니다.

감사의 말

저자는 이 원고에 대한 비판적 검토에 대해 Tan Ke En과 Dr. Cameron Bracken에게 감사를 표합니다. 이 작업은 기초 연구 보조금 제도(FRGS/1/2020/SKK0/UM/02/15) 및 말라야 대학교 임팩트 연구 보조금(UM. C/625/1/HIR/MOE/CHAN/02/07)입니다.

자료

NameCompanyCatalog NumberComments
BedtoolsGitHubhttps://github.com/arq5x/bedtools2/Referring to section 4.1.2. Needed for Circr.
BWABurrows-Wheeler Alignerhttp://bio-bwa.sourceforge.net/Referring to section 2.1.1 and 2.1.2. Needed to run CIRIquant, and to index the genome
CircrGitHubhttps://github.com/bicciatolab/CircrReferring to section 4. Use to predict the miRNA binding sites
CIRIquantGitHubhttps://github.com/bioinfo-biols/CIRIquantReferring to section 2.1.3. To predict circRNAs
ClusterprofilerGitHubhttps://github.com/YuLab-SMU/clusterProfilerReferring to section 7. For GO and KEGG functional enrichment
CPUIntel Intel(R) Xeon(R) CPU E5-2620 V2 @ 2.10 GHz   Cores: 6-core CPU Memory: 65 GB Graphics card: NVIDIA GK107GL (QUADRO K2000) Specifications used to run this entire protocol.
CytoscapeCytoscapehttps://cytoscape.org/download.htmlReferring to section 5.2. Needed to plot ceRNA network
FastQCBabraham Bioinformaticshttps://www.bioinformatics.babraham.ac.uk/projects/fastqc/Referring to section 1.2.1. Quality checking on Fastq files
HISAT2http://daehwankimlab.github.io/hisat2/Referring to section 2.1.1 and 2.1.2. Needed to run CIRIquant, and to index the genome
LinuxUbuntu 20.04.5 LTS (Focal Fossa)https://releases.ubuntu.com/focal/Needed to run the entire protocol. Other Ubuntu versions may still be valid to carry out the protocol.
miRandahttp://www.microrna.org/microrna/getDownloads.doReferring to section 4.1.2. Needed for Circr
Pybedtoolspybedtools 0.8.2https://pypi.org/project/pybedtools/Needed for BED file genomic manipulation
PythonPython 2.7 and 3.6 or aboverhttps://www.python.org/downloads/To run necessary library modules
RThe Comprehensive R Archive Networkhttps://cran.r-project.org/To manipulate dataframes
RNAhybridBiBiServhttps://bibiserv.cebitec.uni-bielefeld.de/rnahybridReferring to section 4.1.2. Needed for Circr
RStudioRStudiohttps://www.rstudio.com/A workspace to run R
samtools SAMtoolshttp://www.htslib.org/Referring to section 2.1.2. Needed to run CIRIquant
StringTieJohns Hopkins University: Center for Computational Biologyhttp://ccb.jhu.edu/software/stringtie/index.shtmlReferring to section 2.1.2. Needed to run CIRIquant
TargetScanGitHubhttps://github.com/nsoranzo/targetscanReferring to section 4.1.2. Needed for Circr

참고문헌

  1. Raman, K., Bhat, A. G., Chandra, N. A systems perspective of host-pathogen interactions: predicting disease outcome in tuberculosis. Molecular BioSystems. 6 (3), 516-530 (2010).
  2. Casadevall, A., Pirofski, L. A. Host-pathogen interactions: basic concepts of microbial commensalism, colonization, infection, and disease. Infection and Immunity. 68 (12), 6511-6518 (2000).
  3. Yang, E., Li, M. M. H. All About the RNA: Interferon-stimulated genes that interfere with viral RNA processes. Frontiers in Immunology. 11, 605024 (2020).
  4. Schneider, W. M., Chevillotte, M. D., Rice, C. M. Interferon-stimulated genes: A complex web of host defenses. Annual Review of Immunology. 32 (1), 513-545 (2014).
  5. Shirahama, S., Miki, A., Kaburaki, T., Akimitsu, N. Long non-coding RNAs involved in pathogenic infection. Frontiers in Genetics. 11, 454 (2020).
  6. Chandan, K., Gupta, M., Sarwat, M. Role of host and pathogen-derived microRNAs in immune regulation during infectious and inflammatory diseases. Frontiers in Immunology. 10, 3081 (2019).
  7. Chen, X., et al. Circular RNAs in immune responses and immune diseases. Theranostics. 9 (2), 588-607 (2019).
  8. Kristensen, L. S., et al. The biogenesis, biology and characterization of circular RNAs. Nature Reviews Genetics. 20 (11), 675-691 (2019).
  9. Ashwal-Fluss, R., et al. circRNA biogenesis competes with pre-mRNA splicing. Molecular Cell. 56 (1), 55-66 (2014).
  10. Conn, S. J., et al. The RNA binding protein quaking regulates formation of circRNAs. Cell. 160 (6), 1125-1134 (2015).
  11. Zhang, X. O., et al. Complementary sequence-mediated exon circularization. Cell. 159 (1), 134-147 (2014).
  12. Robic, A., Demars, J., Kuhn, C. In-depth analysis reveals production of circular RNAs from non-coding sequences. Cells. 9 (8), 1806 (2020).
  13. Eger, N., Schoppe, L., Schuster, S., Laufs, U., Boeckel, J. N. Circular RNA splicing. Advances in Experimental Medicine and Biology. 1087, 41-52 (2018).
  14. Barrett, S. P., Wang, P. L., Salzman, J. Circular RNA biogenesis can proceed through an exon-containing lariat precursor. eLife. 4, 07540 (2015).
  15. Memczak, S., et al. Circular RNAs are a large class of animal RNAs with regulatory potency. Nature. 495 (7441), 333-338 (2013).
  16. Misir, S., Wu, N., Yang, B. B. Specific expression and functions of circular RNAs. Cell Death and Differentiation. 29 (3), 481-491 (2022).
  17. Bai, S., et al. Construct a circRNA/miRNA/mRNA regulatory network to explore potential pathogenesis and therapy options of clear cell renal cell carcinoma. Scientific Reports. 10 (1), 13659 (2020).
  18. Sakshi, S., Jayasuriya, R., Ganesan, K., Xu, B., Ramkumar, K. M. Role of circRNA-miRNA-mRNA interaction network in diabetes and its associated complications. Molecular Therapy - Nucleic Acids. 26, 1291-1302 (2021).
  19. Hansen, T. B., et al. miRNA-dependent gene silencing involving Ago2-mediated cleavage of a circular antisense RNA. The EMBO Journal. 30 (21), 4414-4422 (2011).
  20. Lu, M. Circular RNA: functions, applications, and prospects. ExRNA. 2 (1), 15 (2020).
  21. Liu, K. S., Pan, F., Mao, X. D., Liu, C., Chen, Y. J. Biological functions of circular RNAs and their roles in occurrence of reproduction and gynecological diseases. American Journal of Translational Research. 11 (1), 1-15 (2019).
  22. Pamudurti, N. R., et al. Translation of CircRNAs. Molecular Cell. 66 (1), 9-21 (2017).
  23. Legnini, I., et al. Circ-ZNF609 Is a circular RNA that can be translated and functions in myogenesis. Molecular Cell. 66 (1), 22-37 (2017).
  24. Weigelt, C. M., et al. An insulin-sensitive circular RNA that regulates lifespan in Drosophila. Molecular Cell. 79 (2), 268-279 (2020).
  25. Guo, Y., et al. Identification and characterization of circular RNAs in the A549 cells following Influenza A virus infection. Veterinary Microbiology. 267, 109390 (2022).
  26. Qu, Z., et al. A novel intronic circular RNA antagonizes influenza virus by absorbing a microRNA that degrades CREBBP and accelerating IFN-β production. mBio. 12 (4), 0101721 (2021).
  27. Kawarada, Y., et al. TGF-β induces p53/Smads complex formation in the PAI-1 promoter to activate transcription. Scientific Reports. 6 (1), 35483 (2016).
  28. Yu, T., et al. Circular RNA GATAD2A promotes H1N1 replication through inhibiting autophagy. Veterinary Microbiology. 231, 238-245 (2019).
  29. FastQC: A quality control tool for high throughput sequence data. Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ (2010)
  30. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  31. Zhang, J., Chen, S., Yang, J., Zhao, F. Accurate quantification of circular RNAs identifies extensive circular isoform switching events. Nature Communications. 11 (1), 90 (2020).
  32. Li, H., Durbin, R. Fast and accurate long-read alignment with Burrows-Wheeler transform. Bioinformatics. 26 (5), 589-595 (2010).
  33. Kim, D., Paggi, J. M., Park, C., Bennett, C., Salzberg, S. L. Graph-based genome alignment and genotyping with HISAT2 and HISAT-genotype. Nature Biotechnology. 37 (8), 907-915 (2019).
  34. Pertea, M., et al. StringTie enables improved reconstruction of a transcriptome from RNA-seq reads. Nature Biotechnology. 33 (3), 290-295 (2015).
  35. Li, H., et al. The Sequence Alignment/Map format and SAMtools. Bioinformatics. 25 (16), 2078-2079 (2009).
  36. Wang, L., Wang, S., Li, W. RSeQC: quality control of RNA-seq experiments. Bioinformatics. 28 (16), 2184-2185 (2012).
  37. Dori, M., Caroli, J., Forcato, M. Circr, a computational tool to identify miRNA:circRNA associations. Frontiers in Bioinformatics. 2, 852834 (2022).
  38. Shannon, P., et al. Cytoscape: a software environment for integrated models of biomolecular interaction networks. Genome Research. 13 (11), 2498-2504 (2003).
  39. Wu, T., et al. clusterProfiler 4.0: A universal enrichment tool for interpreting omics data. The Innovation. 2 (3), 100141 (2021).
  40. Yu, G., Wang, L. G., Han, Y., He, Q. Y. clusterProfiler: an R package for comparing biological themes among gene clusters. OMICS: A Journal of Integrative Biology. 16 (5), 284-287 (2012).
  41. . org.Hs.eg.db: Genome wide annotation for human. 2022. R package version 3.15.0 Available from: https://bioconductor.org/packages/release/data/annotation/html/org.Hs.eg.db.html (2022)
  42. Barrett, T., et al. NCBI GEO: archive for functional genomics data sets-update. Nucleic Acids Research. 41, 991-995 (2012).
  43. Gao, Y., Zhang, J., Zhao, F. Circular RNA identification based on multiple seed matching. Briefings in Bioinformatics. 19 (5), 803-810 (2018).
  44. Zhang, X. O., et al. Diverse alternative back-splicing and alternative splicing landscape of circular RNAs. Genome Research. 26 (9), 1277-1287 (2016).
  45. Memczak, S., et al. Circular RNAs are a large class of animal RNAs with regulatory potency. Nature. 495 (7441), 333-338 (2013).
  46. Wang, K., et al. MapSplice: Accurate mapping of RNA-seq reads for splice junction discovery. Nucleic Acids Research. 38 (18), 178 (2010).
  47. Song, X., et al. Circular RNA profile in gliomas revealed by identification tool UROBORUS. Nucleic Acids Research. 44 (9), 87 (2016).
  48. Hansen, T. B. Improved circRNA identification by combining prediction algorithms. Frontiers in Cell and Developmental Biology. 6, 20 (2018).
  49. Robinson, M. D., McCarthy, D. J., Smyth, G. K. edgeR: A bioconductor package for differential expression analysis of digital gene expression data. Bioinformatics. 26 (1), 139-140 (2010).
  50. Ma, X. K., et al. CIRCexplorer3: A CLEAR pipeline for direct comparison of circular and linear RNA expression. Genomics Proteomics Bioinformatics. 17 (5), 511-521 (2019).
  51. Gaffo, E., Buratin, A., Dal Molin, A., Bortoluzzi, S. Sensitive, reliable and robust circRNA detection from RNA-seq with CirComPara2. Briefings in Bioinformatics. 23 (1), (2022).
  52. Glažar, P., Papavasileiou, P., Rajewsky, N. circBase: a database for circular RNAs. RNA. 20 (11), 1666-1670 (2014).
  53. Tan, S., et al. Circular RNA F-circEA-2a derived from EML4-ALK fusion gene promotes cell migration and invasion in non-small cell lung cancer. Molecular Cancer. 17 (1), 138 (2018).
  54. Guarnerio, J., et al. Oncogenic role of Fusion-circRNAs Derived from cancer-associated chromosomal translocations. Cell. 165 (2), 289-302 (2016).
  55. McGeary, S. E., et al. The biochemical basis of microRNA targeting efficacy. Science. 366 (6472), (2019).
  56. Enright, A. J., et al. MicroRNA targets in Drosophila. Genome Biology. 5 (1), 1 (2003).
  57. Rehmsmeier, M., Steffen, P., Hochsmann, M., Giegerich, R. Fast and effective prediction of microRNA/target duplexes. RNA. 10 (10), 1507-1517 (2004).
  58. Zhang, D., et al. AllEnricher: a comprehensive gene set function enrichment tool for both model and non-model species. BMC Bioinformatics. 21 (1), 106 (2020).
  59. Zhou, Y., et al. Metascape provides a biologist-oriented resource for the analysis of systems-level datasets. Nature Communications. 10 (1), 1523 (2019).

재인쇄 및 허가

JoVE'article의 텍스트 или 그림을 다시 사용하시려면 허가 살펴보기

허가 살펴보기

더 많은 기사 탐색

188RNAcircRNA

This article has been published

Video Coming Soon

JoVE Logo

개인 정보 보호

이용 약관

정책

연구

교육

JoVE 소개

Copyright © 2025 MyJoVE Corporation. 판권 소유