miRDeep2 peut être utilisé pour identifier avec précision les microARN végétaux qui sont d’importants régulateurs transcriptionnels dans le développement des plantes et qui sont essentiels pour répondre aux défis environnementaux. miRDeep2 nécessite un temps de fonctionnement nettement court et présente une excellente performance à la fois en sensibilité et en précision, en particulier pour prédire le microARN chez les plantes ayant un grand génome. Les faux positifs et le temps de traitement long sont des défis dans l’annotation de microARN de plante.
En ajoutant une nouvelle stratégie de fielding, en révisant l’algorithme de notation et en intégrant des critères rigoureux, miRDeep2 peut surmonter ces problèmes. L’annotation microARN à haute confiance est fondamentale pour découvrir le rôle du microARN dans la régulation de diverses fonctions du génome. Des conseils étape par étape peuvent être utiles pour les annotateurs microARN pour la première fois.
Pour les chercheurs expérimentés, la méthode est utile pour comprendre les avantages et les avantages de l’utilisation de miRDeep2 par rapport à d’autres outils. Pour installer le paquet miRDeep2, accédez à la page Web miRDeep2 et récupérez les fichiers tarball. Puis extraire tous les contenus du fichier téléchargé dans un dossier et définir le chemin de dossier au chemin.
Pour tester le pipeline miRDeep2, téléchargez les données de test et la sortie attendue contenant un fichier de séquençage GSM formaté et un fichier génome Arabidopsis thaliana et déplacez tous les fichiers téléchargés vers l’annuaire de travail actuel. Après avoir extrait les fichiers de tarball compressés, construisez l’index de référence du génome d’Arabidopsis et l’indice de référence de l’ARN non codant. Un dossier sera généré automatiquement dans le user_selected_folder contenant tous les fichiers intermédiaires et les résultats.
Le pipeline miRDeep2 peut ensuite être exécuté à l’aide des données d’essai. Pour vérifier les sorties de test, consultez le fichier de sortie délimité par onglet. La sortie finale des microARN prévus contiendra des colonnes qui indiquent l’ID chromosomique, la direction du brin, l’ID de lecture représentatif, l’ID précurseur, l’emplacement du miARN mature, l’emplacement du précurseur, la séquence mature et la séquence précurseur.
Vérifiez ensuite le fichier progress_log qui fournit des informations sur les étapes terminées et les fichiers script_log et script_err qui contiennent des sorties de programme et des avertissements. Avant d’exécuter le pipeline, pour s’assurer que les lectures d’entrée sont prétraitées dans le format approprié, retirez les adaptateurs des cinq et trois extrémités principales des lectures de séquençage profond et assurez-vous que tous les identificateurs FAST A sont uniques. Chaque identificateur de séquence doit se terminer par un soulignement x et un entier indiquant le numéro de copie de la séquence exacte qui a été récupérée dans les ensembles de données de séquençage profond.
Pour assurer un identificateur EX-RAPIDE unique, inclure un numéro en cours d’exécution dans le ID.To créer un indice de référence, si les séquences génomiques de l’espèce d’intérêt ont été indexées, téléchargez les fichiers d’index Bowtie 2 à partir du site Web d’iGenomes. Ensuite, construisez un indice d’ARN non codant non microARN contenant les principales séquences non codantes de l’ARN fam comprenant l’ARN ribosomal, l’ARN de transfert, le petit ARN nucléaire et le petit ARN nucléolar pour filtrer les séquences bruyantes d’autres fragments d’ARN non codants. Pour utiliser miRDeep2 pour détecter de nouveaux microARN à partir de données de séquençage profond, exécutez le script bash dans le paquet pour démarrer le pipeline d’analyse.
Le nombre d’emplacements différents à qui une lecture peut être cartographiée, le numéro d’inadéquation pour l’exécution du nœud papillon 2 et le seuil des lectures par million peuvent être modifiés au besoin. Pour vérifier les sorties miRDeep2, visualisez les données dans les données générées automatiquement output_folder. Dans cette analyse représentative, le pipeline d’annotation de microARN miRDeep2 a été appliqué à 10 bibliothèques publiques de séquence d’ARN de cinq espèces végétales avec une taille de génome graduellement augmentée comme indiqué.
Pour chaque espèce, deux petites bibliothèques représentatives d’ARN provenant de tissus différents et leurs séquences du génome index sont traitées sous forme de deux intrants. En utilisant des méthodes antérieures, le traitement du génome pourrait prendre plus de 100 heures ou parfois s’arrêter au milieu de l’analyse en raison de la longueur du génome. miRDeep2, cependant, terminer ces processus de prédiction dans une période de temps nettement plus courte de minutes à heures.
Pour les deux petits ARN arabidopsis séquencés utilisés dans ce test, miRDeep2 a obtenu de meilleurs résultats en termes de sensibilité et de précision par rapport à d’autres outils. S’il vous plaît assurez-vous que l’index d’entrée pour le programme est correct. Par exemple, n’utilisez Bowtie qu’avec un index Bowtie et utilisez une grande option d’index pour les grands génomes.
Les cibles du microARN qui en résulte peuvent être prédites à l’aide de données de séquençage qui peuvent fournir un aperçu de la fonction microARN. Comme miRDeep2 peut être utilisé pour identifier avec précision et sensibilité la plupart des microARN chez une espèce végétale spécifique, le rôle de la fonction microARN dans son ensemble peut être étudié.