마이크로 RNA의 전산 식별은 높은 위양성 예측을 산출합니다. 최근 업데이트를 통해 mirMachine은 알려진 새로운 마이크로 RNA 예측에서 높은 감도와 특이성을 제공합니다. MirMachine은 감도 측면에서 최신 마이크로 RNA 알고리즘보다 우수한 것으로 입증되었으며 mirMachine은 이제 완전히 자동화되고 자유롭게 사용할 수 있으므로 모든 사람이 제공된 지침에 따라 사용할 수 있습니다.
MirMachine은 조직 및 조건에 특정한 데이터의 제한 없이 추정되는 마이크로 RNA의 게놈 전체 분포를 예측할 수 있습니다. msRNA 시퀀싱 실험 전에 예비 데이터를 사용할 수 있으면 중요한 마이크로 RNA 유전자에 대한 검증 프로세스가 빨라집니다. 기계를 설정하기 전에 텍스트 원고의 링크를 사용하여 각 홈 사이트에서 소프트웨어 종속성을 다운로드하고 설치하십시오.
또는 소프트웨어 종속성을 설치하는 더 쉽고 빠른 방법은 텍스트 원고에 제공된 명령을 사용하여 conduct를 사용하는 것입니다. GitHub에서 최신 버전의 mirMachine 스크립트를 단순한 기계 제출 스크립트로 다운로드합니다. 그런 다음 스크립트 경로를 경로 탭으로 설정합니다.
GitHub의 테스트 데이터에서 mirMachine을 실행하여 mirMachine 및 해당 종속성이 올바르게 다운로드되었는지 확인합니다. 표준 출력 스트림으로 화면의 작업 상태를 확인합니다. 완료된 텍스트가 모두 나타나면 출력 파일을 제어합니다.
머리핀 도트 TBL 도트 아웃 도트 TBL 출력 파일을 제어합니다. 두 번째, 세 번째 및 여섯 번째 열에서 성숙한 miRNA pre miRNA와 miRNA 별 서열을 확인합니다. 각 줄의 끝에있는 염색체에서 예측 된 miRNA의 위치를 찾으십시오.
그런 다음 로그 파일에서 프로그램 출력 및 경고를 확인합니다. 상동성 기반 식별을 위해 bash 스크립트를 사용하여 mirMachine을 실행하고 예측된 mRNA를 확인합니다. 성숙한 miRNA 및 pre miRNA 가장 빠른 서열에 대한 출력 파일과 헤어핀 로그 파일의 출력 파일을 찾습니다.
새로운 miRNA 동정을 위해 sRNA-seq Fast Q 파일을 적절한 FASTA 형식으로 사전 처리합니다. 어댑터를 다듬고 sRNA-seq 읽기에 대한 전처리가 mirMachine의 일부가 아니므로 N을 포함하는 것과 같은 저품질 읽기를 제거합니다. 제출된 데이터에 대해 안정적인 트리밍 도구와 트리밍 매개변수를 선택합니다.
FASTQ 파일을 입력 파일로 FASTA 파일로 변환합니다. 풍부 테이블 파일이 제공되는 경우 mirMachine 스크립트와 함께 제공된 수정 스크립트를 사용하여 테이블 파일을 적절한 FASTA 입력으로 변환합니다. 그런 다음 bash 스크립트를 사용하여 mirMachine을 실행합니다.
예측된 miRNA를 확인합니다. 예측된 mRNA 및 prem miRNA FASTA 서열에 대한 출력 파일과 헤어핀 로그 파일에 대한 출력 파일을 찾습니다. dash DB 옵션을 blast 데이터베이스로 설정하여 파이프라인 내에서 빌드 참조 데이터베이스를 건너뜁니다.
대시 M 옵션을 허용되는 불일치 수로 설정하고 대시 N을 정렬 후 제거할 적중 수로 설정합니다. 종에 따라 변경하십시오. 대시를 사용하여 용의자 목록에 대한 2차 구조를 평가하고, 대시를 사용하여 sRNA-seq 데이터에 기초한 신규한 miRNA 예측을 활성화합니다.
대시 Lmax 옵션을 스크리닝에 포함할 S RNA-seq 판독의 최대 길이로 설정하고 대시 Lmin 옵션을 스크리닝에 포함할 sRNA-서열 판독의 최소 길이로 설정합니다. 대시 RPM 옵션을 사용하여 백만 개당 읽기 임계값을 설정합니다. 대표 분석에서.
IWGSC 밀의 염색체 5 A로부터의 mRNA 패밀리의 분포가 표시된다. mRNA의 가장 높은 대표 그룹은 18개의 확인된 miRNA가 있는 miR9666이었습니다. 애기장대 탈리아나 및 밀 종에 대한 mirMachine의 성능은 miRDP2와 비교됩니다.
민감도와 두 번째 양성의 비교는 mirMachine이 애기장대 데이터에서 miRDP2를 능가하는 것으로 나타났습니다. 밀 데이터의 경우 발현 증거를 통한 mirMachine 상동성 기반 예측은 miRDP2보다 더 나은 민감도를 제공했습니다. 두 게놈 모두에 대해 miRDP2는 sRNAs-seq 및 상동성 기반 예측보다 더 많은 수의 참양성을 예측했습니다.
필요한 응용 프로그램을 설정하는 것은 경험이없는 사용자에게 부담이 될 수 있습니다. 이 비디오 자습서를 따르면 도움이 될 것입니다. 설치 프로세스의 시각화는 비 계산 연구원이 기본 컴퓨팅에 들어가도록 장려합니다.
또한 비디오의 출력 파일을 조사하면 사용자가 결과를 해석하는 데 확실히 도움이 됩니다.