L’identification informatique des micro-ARN donne des prédictions faussement positives élevées. Avec les mises à jour récentes, mirMachine offre une sensibilité et une spécificité élevées dans les prédictions de micro-ARN connues et nouvelles. MirMachine s’est avéré supérieur aux algorithmes de micro-ARN les plus récents en termes de sensibilité et mirMachine est maintenant entièrement automatisé et disponible gratuitement afin que tout le monde puisse l’utiliser avec les instructions fournies.
MirMachine peut prédire la distribution à l’échelle du génome des micro-ARN putatifs sans limitation des données spécifiques aux tissus et aux conditions. La disponibilité des données préliminaires avant l’expérience de séquençage de l’ARNms accélérerait le processus de vérification des gènes importants de micro-ARN. Avant de configurer la machine, téléchargez et installez les dépendances logicielles à partir des sites d’accueil respectifs en utilisant les liens dans le manuscrit texte.
Alternativement, un moyen plus simple et plus rapide d’installer les dépendances logicielles consiste à utiliser la conduite à l’aide des commandes fournies dans le manuscrit du texte. Téléchargez la dernière version des scripts mirMachine le script de soumission de machine simple à partir de GitHub. Définissez ensuite le chemin d’accès des scripts dans l’onglet chemin.
Assurez-vous que mirMachine et ses dépendances ont été téléchargés correctement en exécutant mirMachine sur les données de test de GitHub. Vérifiez l’état de la tâche à l’écran par le flux de sortie standard. Une fois que tout le texte terminé apparaît, contrôlez les fichiers de sortie.
Contrôlez les épingles à cheveux point TBL point out point TBL fichiers de sortie. Remarquez les séquences d’étoiles pré-miARN matures et les séquences d’étoiles miARN sur les deuxième, troisième et sixième colonnes. Trouvez l’emplacement des miARN prédits sur les chromosomes à la fin de chaque ligne.
Vérifiez ensuite les fichiers journaux pour les sorties du programme et les avertissements. Pour l’identification basée sur l’homologie, exécutez la mirMachine en utilisant le script bash et vérifiez les ARNm prédits. Trouvez le fichier de sortie pour les séquences les plus rapides des miARN matures et des pré-miARN, ainsi que le fichier de sortie du fichier journal en épingle à cheveux.
Pour une nouvelle identification de miARN, pré-traitez les fichiers sRNA-seq Fast Q dans le format FASTA approprié. Coupez les adaptateurs et supprimez les lectures de mauvaise qualité comme celles contenant de l’azote car le prétraitement pour les lectures sRNA-seq ne fait pas partie de mirMachine. Choisissez un outil de découpage stable et des paramètres de découpage pour les données soumises.
Convertissez le fichier FASTQ en fichier FASTA en tant que fichier d’entrée. Si un fichier de table d’abondance est fourni, utilisez le script de modification fourni avec les scripts mirMachine pour convertir le fichier de table en une entrée FASTA appropriée. Ensuite, exécutez mirMachine à l’aide du script bash.
Vérifiez les miARN prévus. Recherchez le fichier de sortie pour les séquences FASTA prédites d’ARNm et de miARN prem et le fichier de sortie pour le fichier journal en épingle à cheveux. Définissez l’option dash DB sur une base de données blast pour ignorer la base de données de référence de construction dans le pipeline.
Définissez l’option M sur le nombre de non-concordances autorisées et le tiret N sur le nombre de coups à éliminer après l’alignement. Changez cela en fonction de l’espèce. Utilisez le tiret long pour évaluer les structures secondaires de la liste des suspects, et le tiret pour activer la nouvelle prédiction des miARN basée sur les données de séquençage de l’ARNs.
Réglez l’option tiret L max sur la longueur maximale des lectures S RNA-seq à inclure dans le dépistage et l’option dash L min sur la longueur minimale des lectures sRNA-seq à avoir dans le criblage. Utilisez l’option RPM tiret pour définir le seuil de lectures par million. Dans l’analyse représentative.
La distribution des familles d’ARNm du chromosome cinq A du blé IWGSC est affichée. Le groupe d’ARNm le plus représenté était miR9666 avec 18 miARN identifiés. Performance de la mirMachine sur Arabidopsis thaliana et les espèces de blé par rapport au miRDP2.
Les comparaisons de la sensibilité et des points positifs numéro deux ont montré que mirMachine surpassait miRDP2 sur les données d’Arabidopsis. Pour les données sur le blé, la prédiction basée sur l’homologie mirMachine avec des preuves d’expression a fourni une meilleure sensibilité que miRDP2. Pour les deux génomes, miRDP2 a prédit un nombre plus élevé de vrais positifs que les prédictions basées sur le sRNAs-seq et l’homologie.
La configuration de l’application requise peut être fastidieuse pour l’utilisateur inexpérimenté. Suivre ce tutoriel vidéo aiderait. La visualisation du processus d’installation encouragera les chercheurs non informaticiens à se lancer dans l’informatique de base.
De plus, l’étude des fichiers de sortie dans la vidéo aidera certainement les utilisateurs à interpréter leurs résultats.