원형 RNA는 다양한 생물학적 과정에서 중요한 조절 역할을 합니다. 이 프로토콜은 초보자가 숙주 및 병원체 상호 작용 영역에서 원형 RNA 분석을 수행하는 데 적합합니다. 여기에서 우리는 안전한 RNA 예측 및 정량화, 안전한 RNA 기능 강화, 안전한 RNA, 마이크로 RNA 상호 작용 예측 및 CCE RNA 네트워크 구성에 필요한 간소화된 프로토콜을 만드는 몇 가지 도구를 모았습니다.
이 간소화된 프로토콜은 숙주 및 병원체 상호 작용 환경에서 특정 후보, 진단 및 예후 값을 식별하기 위해 임상 샘플에 적용할 수 있습니다. 사전 프로그래밍 지식이 없는 사람들이 이 기술의 초기 단계를 수행하는 데 어려움을 겪을 것으로 예상합니다. 따라서 이 기술에 사용되는 프로그래밍 언어의 기초를 배우는 것이 좋습니다.
나는 일반적으로 프로그래밍 언어가 어떻게 적용되는지 보는 것이 혼자 읽는 것보다 더 유익하고 이해하기 쉽다고 생각합니다. 시작하려면 Linux 터미널을 열고 호스트의 참조 게놈 디렉터리에서 bwa index 및 hisat2-build 명령을 실행하여 게놈을 인덱싱합니다. 파일 이름, 도구 경로, 다운로드한 참조 파일 경로 및 색인 파일 경로가 포함된 yml 구성 파일을 준비합니다.
RNA 염기서열 데이터의 라이브러리 유형을 지정하고 기본 또는 수동 파라미터를 사용하여 Ciriquant 도구를 실행합니다. RNA 염기서열 데이터의 ID, Ciriquant에서 출력한 GTF 파일의 경로, RNA 염기서열 데이터의 그룹화가 포함된 데이터 목록이 포함된 텍스트 파일을 준비합니다. Linux 터미널에서 준비된 텍스트 파일을 입력으로 사용하여 prep_Ciriquant 실행합니다.
이 실행은 파일 목록을 생성합니다. RNA 염기서열 ID와 해당 문자열 연결 출력 경로가 포함된 데이터 목록이 포함된 두 번째 텍스트 파일을 준비합니다. 파일 레이아웃은 그룹화 열이 실행되지 않고 이전에 준비된 텍스트 파일과 유사해야 합니다.
prepde를 실행합니다. py를 이 텍스트 파일을 입력으로 사용하여 유전자 계수 행렬 파일을 생성합니다. library_info로 Ciri_DE_Replicate 실행합니다.
CSV, circRNA_BSJ. CSV 및 gene_count_matrix. CSV 파일을 입력으로 사용하여 최종 circRNA_DE 출력합니다.
TSV 파일. 차등적으로 발현된 circRNA(DE)의 수를 필터링하고 결정하려면 circRNA_DE 엽니다. R 또는 기타 스프레드시트 소프트웨어가 포함된 tsv 파일.
WinRar 또는 7-Zip과 같은 관련 소프트웨어를 사용하여 CircR GitHub 페이지에서 다운로드한 후 CircR 파일의 압축을 풀고 압축을 풉니다. 분석이 수행될 새 디렉터리로 이동합니다. 그런 다음 circRNA miRNA 분석을 수행하기 전에 SAMTools, miRanda, RNAhybrid 및 Pybedtools와 같은 필수 소프트웨어 애플리케이션을 설치합니다.
SAMtools FAIDX 명령을 사용하여 관심 유기체의 참조 게놈 파일을 색인화하고 탭으로 구분된 침대 파일에서 관심 있는 DE circRNA의 좌표로 구성된 입력 파일을 준비합니다. 그런 다음 Circr을 실행합니다. py를 사용하여 Python3.
그리고 인수가 circRNA 입력 파일, 관심 유기체의 더 빠른 게놈, 선택한 유기체의 게놈 버전, 스레드 수 및 명령줄의 출력 파일 이름을 지정할 때 지정됩니다. Circr 분석이 완료되면 프로그램은 circRNA-miRNA 상호작용 파일을 CSV 형식으로 출력합니다. 관심 있는 circRNA와 표적 miRNA를 포함하는 탭으로 구분된 파일을 준비합니다.
첫 번째 열은 circRNA 이름으로 구성됩니다. 두 번째 열은 첫 번째 열의 RNA 유형을 지정합니다. 세 번째 열은 표적 miRNA입니다.
그리고 네 번째 열은 세 번째 열에서 RNA의 유형을 지정합니다. ceRNA 네트워크 맵을 구성하려면 Cytoscape 소프트웨어를 열고 file, import, network from file로 이동하여 준비된 파일을 선택하고 업로드합니다. 스타일 버튼을 눌러 네트워크의 비주얼 스타일을 변경합니다.
그런 다음 채우기 색상의 오른쪽에 있는 화살표를 누르고 열에 대해 유형을 선택하고 매핑 유형에 대해 이산 매핑을 선택한 다음 각 RNA 유형에 대해 원하는 색상을 선택합니다. 그런 다음 shape로 이동하여 노드의 모양을 변경하고 앞에 표시된 단계를 따릅니다. circRNA의 부모 유전자에 대한 유전자 온톨로지 및 KEGG 분석을 위해 클러스터 프로파일러와 조직을 확인하십시오. Hs.eg.
DB 패키지가 스튜디오에 설치되었습니다. DE circRNA 정보를 R 스튜디오 작업 영역으로 가져옵니다. 사용자가 부모 유전자 이름을 entrezid와 같은 다른 형식으로 변환하려는 경우 bidder와 같은 기능을 사용합니다.
유전자 ID를 입력으로 사용하고 기본 파라미터를 사용하여 클러스터 프로파일 또는 패키지 내에서 enrichGO 함수를 사용하여 유전자 온톨로지 및 농축 분석을 실행합니다. 마지막으로, 유전자 ID를 입력으로 사용하고 클러스터 프로파일러 패키지 내에서 enrichKEGG 함수를 사용하여 KEGG 보강 분석을 실행합니다. DE circRNA 부모 유전자의 유전자 온톨로지 농축 분석의 버블 플롯이 이 그림에 나와 있습니다.
x축의 유전자 비율은 주어진 유전자 온톨로지 용어와 관련된 입력 목록의 유전자 수를 해당 용어의 총 유전자 수로 나눈 값입니다. 그림의 점 크기는 주어진 유전자 온톨로지 용어와 관련된 입력 목록의 유전자 수인 count 값으로 표시됩니다. 점의 크기가 클수록 용어와 관련된 입력 유전자의 수가 많아집니다.
그림의 점들은 주석 항의 관측 빈도와 우연히 예상되는 빈도를 비교하여 계산되는 pvalue를 기반으로 색상으로 구분됩니다. 강화는 통계적으로 유의하며 p값이 0.01보다 작은 경우에만 버블 그림에 표시됩니다. 여기서 생물학적 과정에 대한 상위 3가지 농축에는 리보핵단백질 복합체 생물 발생, 바이러스에 대한 반응 및 생물학적 자극에 대한 반응 조절이 포함됩니다.
분자 기능의 경우 RNA에 작용하는 촉매 활성과 단일 가닥 RNA 결합만 통계적으로 풍부합니다. 세포 성분의 경우, 레트로 머 복합체 만이 통계적으로 풍부합니다. 이 대표 이미지는 버블 플롯에서 DE circRNA 부모 유전자의 KEGG 농축 분석을 보여줍니다.
이 경우 두 가지 KEGG 용어, 즉 인플루엔자 A와 바이러스 수명 주기 경로만 강화되었습니다. 이 절차를 시도할 때 가장 중요한 것 중 하나는 부상을 입을 때 사용하는 RNA 순환 데이터 세트의 올바른 형질 유형을 확인하는 것입니다. 여기에 제공된 생물 형식 파이프라인은 잠재적인 세속적 RNA와 기능적 주석을 예측하는 데 도움이 됩니다.
그러나 확실한 증거를 제공하기 위해서는 여전히 잘 주도된 검증이 필요합니다. 이 프로토콜을 통해 연구자들은 추가 연구를 할 수 있는 다양한 코드 및 병원체 상호 작용에서 안전한 RNA와 잠재적인 기능적 역할을 발견할 수 있습니다.