La identificación computacional de micro ARN produce altas predicciones de falsos positivos. Con las actualizaciones recientes, mirMachine proporciona una alta sensibilidad y especificidad en predicciones conocidas y novedosas de micro ARN. MirMachine ha demostrado ser superior a los algoritmos de micro ARN más recientes en términos de sensibilidad y mirMachine ahora está totalmente automatizado y disponible gratuitamente para que todos puedan usarlo con las instrucciones proporcionadas.
MirMachine puede predecir la distribución en todo el genoma de los micro ARN putativos sin limitación de los datos específicos de tejidos y condiciones. La disponibilidad de los datos preliminares antes del experimento de secuenciación de ARNms aceleraría el proceso de verificación de los importantes genes de microARN. Antes de configurar la máquina, descargue e instale las dependencias de software de los respectivos sitios de inicio utilizando los enlaces en el manuscrito de texto.
Alternativamente, una forma más fácil y rápida de instalar las dependencias del software es usar la conducta utilizando los comandos proporcionados en el texto manuscrito. Descargue la última versión de los scripts mirMachine, el mero script de envío de máquinas desde GitHub. A continuación, establezca la ruta de los scripts en la pestaña de ruta.
Asegúrese de que mirMachine y sus dependencias se hayan descargado correctamente ejecutando mirMachine en datos de prueba desde GitHub. Compruebe el estado del trabajo en la pantalla mediante el flujo de salida estándar. Una vez que aparezca todo el texto terminado, controle los archivos de salida.
Controle las horquillas punto TBL punto salida archivos de salida TBL. Observe las secuencias de estrellas de miARN maduro y miARN en la segunda, tercera y sexta columnas. Encuentra la ubicación de los miARN predichos en los cromosomas al final de cada línea.
A continuación, compruebe los archivos de registro para las salidas y advertencias del programa. Para la identificación basada en homología, ejecute mirMachine utilizando el script bash y verifique los ARNm predichos. Encuentre el archivo de salida para las secuencias más rápidas de miARN maduros y pre miARN, así como el archivo de salida para el archivo de registro de horquilla.
Para una nueva identificación de miARN, preprocese los archivos sRNA-seq Fast Q en el formato FASTA adecuado. Recorte los adaptadores y elimine las lecturas de baja calidad como las que contienen N, ya que el preprocesamiento para las lecturas de sRNA-seq no forma parte de mirMachine. Elija una herramienta de recorte estable y parámetros de recorte para los datos enviados.
Convierta el archivo FASTQ en un archivo FASTA como archivo de entrada. Si se proporciona un archivo de tabla de abundancia, utilice el script de modificación proporcionado con los scripts mirMachine para convertir el archivo de tabla en una entrada FASTA adecuada. A continuación, ejecute mirMachine utilizando el script bash.
Compruebe los miRNAs predichos. Busque el archivo de salida para los ARNm previstos y las secuencias FASTA de miARN prem y el archivo de salida para el archivo de registro de horquilla. Establezca la opción dash DB en una base de datos de explosión para omitir la base de datos de referencia de construcción dentro de la canalización.
Establezca la opción M del guión en el número de discrepancias permitidas y el guión N en el número de aciertos que se eliminarán después de la alineación. Cambie esto según la especie. Use el guión largo para evaluar las estructuras secundarias para la lista de sospechosos, y el guión para activar la nueva predicción de miARN basada en datos de sRNA-seq.
Establezca la opción dash L max en la longitud máxima de las lecturas de S RNA-seq para incluir en la detección y la opción dash L min en la longitud mínima de las lecturas de sRNA-seq que debe tener en la selección. Utilice la opción RPM del guión para establecer el umbral de lecturas por millón. En el análisis representativo.
Se muestra la distribución de las familias de ARNm del cromosoma cinco A del trigo IWGSC. El grupo de ARNm más representado fue miR9666 con 18 miARN identificados. Rendimiento de la mirMachine en especies de Arabidopsis thaliana y trigo en comparación con la miRDP2.
Las comparaciones de la sensibilidad y los positivos número dos mostraron que mirMachine superó a miRDP2 en los datos de Arabidopsis. Para los datos de trigo, la predicción basada en la homología de mirMachine con evidencia de expresión proporcionó una mejor sensibilidad que miRDP2. Para ambos genomas, miRDP2 predijo un mayor número de verdaderos positivos que sRNAs-seq y las predicciones basadas en homología.
Configurar la aplicación requerida podría ser una carga para el usuario sin experiencia. Seguir este video tutorial ayudaría. La visualización del proceso de instalación alentará a los investigadores no computacionales a entrar en la computación básica.
Además, investigar los archivos de salida en el video definitivamente ayudará a los usuarios a interpretar sus resultados.