微RNA的计算鉴定产生高假阳性预测。随着最近的更新,mirMachine在已知和新型微RNA预测中提供了高灵敏度和特异性。事实证明,MirMachine 在灵敏度方面优于最新的微型 RNA 算法,mirMachine 现在是完全自动化且免费提供的,因此每个人都可以在提供的说明下使用它。
MirMachine可以预测假定的micro RNA的全基因组分布,而不受组织和条件特定数据的限制。在msRNA测序实验之前获得初步数据将加快重要micro RNA基因的验证过程。在设置机器之前,请使用文本手稿中的链接从相应的主站点下载并安装软件依赖项。
或者,安装软件依赖项的一种更简单、更快捷的方法是使用文本手稿中提供的命令进行 conduct。从 GitHub 下载最新版本的 mirMachine 脚本,即单纯的机器提交脚本。然后将脚本路径设置为路径选项卡。
通过从 GitHub 对测试数据运行 mirMachine,确保已正确下载 mirMachine 及其依赖项。通过标准输出流在屏幕上检查作业状态。出现所有完成的文本后,控制输出文件。
控制发夹点TBL点出点TBL输出文件。注意第二、第三和第六列上的成熟 miRNA 前 miRNA 和 miRNA 星序列。在每行末尾找到预测的miRNA在染色体上的位置。
然后检查日志文件中的程序输出和警告。对于基于同源性的鉴定,使用 bash 脚本运行 mirMachine 并检查预测的 mRNA。查找成熟 miRNA 和前 miRNA 最快序列的输出文件,以及发夹日志文件的输出文件。
对于新型 miRNA 鉴定,将 sRNA-seq Fast Q 文件预处理为正确的 FASTA 格式。修剪适配器并删除低质量的读取,例如包含N的读数,因为sRNA-seq读取的预处理不是mirMachine的一部分。为提交的数据选择稳定的修剪工具和修剪参数。
将 FASTQ 文件转换为 FASTA 文件作为输入文件。如果提供了丰度表文件,请使用 mirMachine 脚本随附的修改脚本将表文件转换为正确的 FASTA 输入。然后使用 bash 脚本运行 mirMachine。
检查预测的miRNA。查找预测的 mRNA 和前 miRNA FASTA 序列的输出文件以及发夹日志文件的输出文件。将破折号数据库选项设置为爆炸数据库,以跳过管道中的建筑参考数据库。
将短划线 M 选项设置为允许的不匹配数,将短划线 N 设置为对齐后要消除的命中数。根据物种进行更改。使用长破折号评估嫌疑人列表的二级结构,使用破折号激活基于 sRNA-seq 数据的新型 miRNA 预测。
将破折号 L max 选项设置为要包含在筛选中的 S RNA-seq 读数的最大长度,将破折号 L min 选项设置为筛选中要具有的 sRNA-seq 读数的最小长度。使用虚线 RPM 选项设置每百万读取数阈值。在代表性分析中。
显示了IWGSC小麦五号染色体A的mRNA家族的分布。代表性最高的mRNA组是miR9666,有18个已鉴定的miRNA。与miRDP2相比,拟南芥和小麦的性能。
灵敏度和第二大阳性的比较表明,mirMachine在拟南芥数据上优于miRDP2。对于小麦数据,基于miMachine同源性的表达证据预测提供了比miRDP2更好的灵敏度。对于这两个基因组,miRDP2预测的真阳性数量高于sRNA-seq和基于同源性的预测。
对于没有经验的用户来说,设置所需的应用程序可能会很麻烦。遵循此视频教程会有所帮助。安装过程的可视化将鼓励非计算研究人员进入一些基本的计算。
此外,调查视频中的输出文件肯定会帮助用户解释他们的结果。