Un abonnement à JoVE est nécessaire pour voir ce contenu. Connectez-vous ou commencez votre essai gratuit.
Nous présentons ici un protocole démontrant l’installation et l’utilisation d’un pipeline bioinformatique pour analyser les données de séquençage chimérique de l’ARN utilisées dans l’étude des interactions ARN :ARN in vivo .
La compréhension des interactions in vivo entre les gènes régulateurs des petits ARN non codants (ARNsnc), tels que les microARN (miARN), et leurs ARN cibles, a progressé ces dernières années grâce à des approches biochimiques qui utilisent la réticulation suivie d’une ligature pour capturer les interactions ARN snc :ARN cible par la formation d’ARN chimériques et de banques de séquençage ultérieures. Bien que les ensembles de données issus du séquençage chimérique de l’ARN fournissent des données à l’échelle du génome et soient beaucoup moins ambigus que les logiciels de prédiction des miARN, la distillation de ces données en informations significatives et exploitables nécessite des analyses supplémentaires et peut dissuader les chercheurs qui n’ont pas de connaissances en informatique. Ce rapport fournit un tutoriel pour aider les biologistes computationnels débutants à installer et à appliquer un outil logiciel open source récent : Small Chimeric RNA Analysis Pipeline (SCRAP). Les exigences de la plate-forme, les mises à jour et une explication des étapes du pipeline et de la manipulation des variables d’entrée utilisateur clés sont fournies. La réduction d’un obstacle pour les biologistes à l’obtention d’informations à partir d’approches chimériques de séquençage de l’ARN a le potentiel de servir de tremplin à des recherches fondées sur la découverte d’interactions régulatrices entre l’ARNnc et l’ARN cible dans de multiples contextes biologiques.
Les petits ARN non codants sont très étudiés pour leur rôle post-transcriptionnel dans la coordination de l’expression de suites de gènes dans divers processus tels que la différenciation et le développement, le traitement du signal et la maladie 1,2,3. La capacité de déterminer avec précision les transcrits cibles des petits ARN non codants (ARNsnc) régulateurs des gènes, y compris les microARN (miARN), est importante pour les études de biologie de l’ARN aux niveaux fondamental et translationnel. Les algorithmes bioinformatiques qui exploitent la complémentarité anticipée entre la séquence d’amorçage du miARN et ses cibles potentielles ont été fréquemment utilisés pour la prédiction des interactions miARN :ARN cible. Bien que ces algorithmes bioinformatiques aient été couronnés de succès, ils peuvent également contenir des résultats à la fois faux positifs et faux négatifs, comme cela a été examiné ailleurs 4,5,6. Récemment, plusieurs approches biochimiques ont été conçues et mises en œuvre qui permettent de déterminer sans ambiguïté et semi-quantitativement les interactions ARNsnc snc :ARN cible in vivo par réticulation in vivo et l’incorporation subséquente d’une étape de ligature pour attacher physiquement l’ARNsnc à sa cible pour former un seul ARN chimérique 4,5,7,8,9,10 . La préparation ultérieure de banques de séquençage à partir des ARN chimériques permet d’évaluer les interactions ARNsnc :ARN cible par traitement informatique des données de séquençage. Cette vidéo fournit un tutoriel pour l’installation et l’utilisation d’un pipeline de calcul appelé small chimeric RNA analysis pipeline (SCRAP), qui est conçu pour permettre une analyse robuste et reproductible des interactions sncRNA :ARN cible à partir de bibliothèques de séquençage d’ARN chimérique6.
L’un des objectifs de ce tutoriel est d’aider les chercheurs à éviter de s’appuyer excessivement sur des algorithmes bioinformatiques purement prédictifs en réduisant les obstacles à l’analyse des données générées par des approches biochimiques fournissant des lectures moléculaires chimériques des interactions ARNsnc :ARN cible. Ce tutoriel fournit des étapes pratiques et des conseils pour guider les informaticiens débutants dans l’utilisation d’un pipeline, SCRAP, développé pour analyser les données de séquençage de l’ARN chimérique, qui peuvent être générées par plusieurs protocoles biochimiques existants, y compris la réticulation, la ligature et le séquençage des hybrides (CLASH) et la ligature covalente des ARN endogènes liés à l’argonaute - réticulation et immunoprécipitation (CLEAR-CLIP)7,9.
L’utilisation de SCRAP offre plusieurs avantages pour l’analyse des données de séquençage d’ARN chimérique, par rapport à d’autres pipelines de calcul6. L’un des principaux avantages est son annotation étendue et l’incorporation d’appels à des scripts bioinformatiques bien pris en charge et régulièrement mis à jour dans le pipeline, par rapport aux pipelines alternatifs qui s’appuient souvent sur des scripts personnalisés et/ou non pris en charge pour les étapes du pipeline. Cette fonctionnalité confère de la stabilité à SCRAP, ce qui permet aux chercheurs de se familiariser avec le pipeline et d’intégrer son utilisation dans leur flux de travail. Il a également été démontré que SCRAP surpasse les pipelines alternatifs dans l’appel des pics d’interactions ARNsnc :ARN cible et qu’il a une fonctionnalité multiplateforme, comme détaillé dans une publication antérieure6.
À la fin de ce didacticiel, les utilisateurs seront en mesure (i) de connaître les exigences de la plate-forme pour SCRAP et d’installer des pipelines SCRAP, (ii) d’installer des génomes de référence et de configurer des paramètres de ligne de commande pour SCRAP, et (iii) de comprendre les critères d’appel de pic et d’effectuer des appels de pics et des annotations de pics.
Cette vidéo décrira en détail comment les chercheurs qui étudient la biologie de l’ARN peuvent installer et utiliser de manière optimale le pipeline de calcul, SCRAP, pour analyser les interactions de l’ARNsnc avec les ARN cibles, tels que les ARN messagers, dans les données de séquençage chimérique de l’ARN obtenues grâce à l’une des approches biochimiques discutées pour la préparation de banques de séquençage.
SCRAP est un utilitaire en ligne de commande. En règle générale, en suivant le guide ci-dessous, l’utilisateur devra (i) télécharger et installer SCRAP (https://github.com/Meffert-Lab/SCRAP), (ii) installer des génomes de référence et exécuter SCRAP, et (iii) effectuer des appels de pics et des annotations.
Vous trouverez de plus amples informations sur les étapes de calcul de cette procédure à l’adresse https://github.com/Meffert-Lab/SCRAP. Cet article fournira la configuration et les informations de base pour permettre aux chercheurs ayant des compétences informatiques de base d’installer, d’optimiser et d’utiliser SCRAP sur des ensembles de données de bibliothèque de séquençage d’ARN chimérique.
REMARQUE : Le protocole commencera par le téléchargement et l’installation du logiciel nécessaire à l’analyse des bibliothèques de séquençage d’ARN chimérique à l’aide de SCRAP.
1. L’installation
2. Exécution de SCRAP
3. Appels de pointe et annotations
4. Visualisation des données
REMARQUE : Toutes les étapes de l’analyse à l’aide de SCRAP sont maintenant terminées. Pour visualiser les données, plusieurs approches sont recommandées :
Les résultats pour l’ARN snc :cible détecté par une version modifiée de SCRAP (version 2.0 de SCRAP, qui implémente des modifications pour le filtrage de l’ARNr) sur des ensembles de données de séquençage précédemment publiés et préparés à l’aide de CLEAR-CLIP9 sont présentés à la figure 2 et au tableau 1. Les utilisateurs peuvent apprécier la diminution des interactions relatives des miARN de fraction avec les régions d’in...
Ce protocole sur l’utilisation du pipeline SCRAP pour l’analyse des interactions ARNsnc :ARN cible est conçu pour aider les chercheurs qui se lancent dans l’analyse informatique. L’achèvement du didacticiel devrait guider les chercheurs ayant une expérience informatique de niveau débutant ou supérieure à travers les étapes requises pour l’installation et l’utilisation de ce pipeline et de son application pour analyser les données obtenues à partir de bibliothèques de séquençage d’ARN chimériqu...
Les auteurs n’ont rien à divulguer.
Nous remercions les membres du laboratoire Meffert pour leurs discussions utiles, y compris BH Powell et WT Mills IV, pour leurs commentaires critiques sur la description de l’installation et de la mise en œuvre du pipeline. Ce travail a été soutenu par un prix de la Fondation Braude, le programme de lancement du Fonds de recherche sur les cellules souches du Maryland, le prix Blaustein Endowment for Pain Research and Education, ainsi que le NINDS RO1NS103974 et le NIMH RO1MH129292 à M.K.M.
Name | Company | Catalog Number | Comments |
Genomes | UCSC Genome browser | N/A | https://genome.ucsc.edu/ or https://www.ncbi.nlm.nih.gov/data-hub/genome/ |
Linux | Linux | Ubuntu 20.04 or 22.04 LTS recommended | |
Mac | Apple | Mac OSX (>11) | |
Platform setup | GitHub | N/A | https://github.com/Meffert-Lab/SCRAP/blob/main/PLATFORM-SETUP.md] |
SCRAP pipeline | GitHub | N/A | https://github.com/Meffert-Lab/SCRAP |
Unix shell | Unix operating system | bash >=5.0 | |
Unix shell | Unix operating system | zsh (5.9 recommended) | |
Windows | Windows | WSL Ubuntu 20.04 or 22.04 LTS |
Demande d’autorisation pour utiliser le texte ou les figures de cet article JoVE
Demande d’autorisationExplorer plus d’articles
This article has been published
Video Coming Soon