Les ARN circulaires jouent un rôle régulateur important dans différents processus biologiques. Ce protocole convient aux débutants pour effectuer une analyse circulaire de l’ARN dans le domaine des interactions entre l’hôte et l’agent pathogène. Ici, nous avons rassemblé quelques-uns des outils pour créer un protocole rationalisé requis pour la prédiction et la quantification sécurisées de l’ARN, l’enrichissement fonctionnel sécurisé de l’ARN, l’ARN sécurisé, la prédiction de l’interaction micro-ARN et les constructions de réseaux d’ARN CCE.
Ce protocole simplifié peut être appliqué aux échantillons cliniques pour identifier certains candidats, valeurs diagnostiques et pronostiques dans un contexte d’interaction entre l’hôte et l’agent pathogène. Je m’attends à ce que ceux qui n’ont aucune connaissance préalable en programmation aient du mal à faire la phase initiale de cette technique. Par conséquent, je conseillerais d’apprendre les bases des langages de programmation utilisés dans cette technique.
Je crois que regarder généralement comment le langage de programmation est appliqué est plus informatif et plus facile à comprendre par rapport à la lecture seule. Pour commencer, ouvrez un terminal Linux et dans le répertoire du génome de référence de l’hôte, exécutez les commandes bwa index et hisat2-build pour indexer le génome. Préparez un fichier de configuration yml contenant le nom du fichier, le chemin des outils, le chemin d’accès aux fichiers de référence téléchargés et le chemin d’accès aux fichiers d’index.
Spécifiez le type de bibliothèque des données de séquence d’ARN et exécutez l’outil Ciriquant à l’aide des paramètres par défaut ou manuels. Préparez un fichier texte avec une liste de données contenant les ID des données de séquence d’ARN, le chemin vers les fichiers GTF sortis par Ciriquant et le regroupement des données de séquence d’ARN s’il s’agit d’un groupe témoin ou traité. Sur le terminal Linux, exécutez prep_Ciriquant avec un fichier texte préparé en entrée.
Cette exécution générera une liste de fichiers. Préparez un deuxième fichier texte avec une liste de données contenant les ID de séquence d’ARN et le chemin d’accès à leur sortie de liaison de chaîne respective. La mise en page du fichier doit être similaire au fichier texte préparé précédemment sans que la colonne de regroupement ne soit exécutée.
Exécutez prepde. PY avec ce fichier texte comme entrée pour générer les fichiers de matrice de numération de gènes. Exécutez Ciri_DE_Replicate avec le library_info.
CSV, circRNA_BSJ. CSV et gene_count_matrix. CSV en entrée pour sortir le circRNA_DE final.
TSV. Pour filtrer et déterminer le nombre de circRNA exprimés différentiellement, ou DE, ouvrez le circRNA_DE. tsv avec R ou tout autre tableur.
Décompressez et extrayez le contenu du fichier CircR après l’avoir téléchargé à partir de la page GitHub CircR à l’aide du logiciel approprié, tel que WinRar ou 7-Zip. Dans un nouveau répertoire où l’analyse sera effectuée. Installez ensuite les applications logicielles prérequises telles que SAMTools, miRanda, RNAhybrid et Pybedtools avant d’effectuer l’analyse des miARN circRNA.
Indexer le fichier génomique de référence de l’organisme d’intérêt à l’aide de la commande SAMtools FAIDX et préparer un fichier d’entrée constitué des coordonnées des circRNA DE d’intérêt dans un fichier de lit délimité par des tabulations. Ensuite, exécutez Circr. py en utilisant Python3.
Et comme les arguments spécifient le fichier d’entrée circRNA, le génome plus rapide de l’organisme d’intérêt, la version génomique de l’organisme sélectionné, le nombre de threads et le nom du fichier de sortie dans la ligne de commande. Une fois l’analyse Circr terminée, le programme génère un fichier d’interaction circRNA-miARN au format CSV. Préparez un fichier délimité par des tabulations contenant les circRNA d’intérêt et leur miARN cible.
La première colonne est constituée du nom de l’ARNc. La deuxième colonne spécifie le type d’ARN de la première colonne. La troisième colonne est le miARN cible.
Et la quatrième colonne spécifie le type d’ARN de la troisième colonne. Pour construire la carte du réseau ceRNA, ouvrez le logiciel Cytoscape, accédez au fichier, importez, réseautez à partir du fichier, sélectionnez le fichier préparé et téléchargez-le. Appuyez sur le bouton de style pour modifier le style visuel du réseau.
Appuyez ensuite sur la flèche sur le côté droit de la couleur de remplissage, choisissez le type pour la colonne, le mappage discret pour le type de mappage et sélectionnez la couleur souhaitée pour chaque type d’ARN. Après cela, accédez à la forme pour modifier la forme des nœuds et suivez les étapes indiquées précédemment. Pour l’ontologie génétique et l’analyse KEGG du gène parental des circRNA, assurez-vous du profileur de cluster et de l’organisation. Hs.eg.
Des paquets de base de données ont été installés dans notre studio. Importez les informations circRNA DE dans l’espace de travail R studio. Si l’utilisateur souhaite convertir les noms de gènes parentaux dans d’autres formats tels que l’entrezid, utilisez une fonction telle que bidder.
Utilisez l’ID de gène comme entrée et exécutez l’ontologie génique et l’analyse d’enrichissement à l’aide de la fonction enrichGO dans le profil de cluster ou le package à l’aide des paramètres par défaut. Enfin, exécutez l’analyse d’enrichissement KEGG en utilisant l’ID de gène comme entrée et la fonction enrichKEGG dans le package de profilage de cluster. Le diagramme à bulles de l’analyse d’enrichissement de l’ontologie génique des gènes parentaux DE circRNA est illustré dans cette figure.
Le rapport des gènes sur l’axe des x est le nombre de gènes dans cette liste d’entrée associés à un terme d’ontologie génétique donné divisé par le nombre total de gènes dans ce terme. La taille du point dans le graphique est représentée par la valeur de comptage qui est le nombre de gènes dans la liste d’entrée associée à un terme d’ontologie génétique donné. Plus la taille des points est grande, plus le nombre de gènes d’entrée associés au terme est important.
Les points du tracé sont codés par couleur en fonction de la valeur qui est calculée en comparant la fréquence observée d’un terme d’annotation avec la fréquence attendue par hasard. L’enrichissement est statistiquement significatif et représenté sur le graphique à bulles uniquement si la valeur est inférieure à 0,01. Ici, les trois principaux enrichissements pour les processus biologiques comprennent la biogenèse du complexe ribonucléoprotéique, la réponse au virus et la régulation de la réponse à un stimulus biotique.
Alors que pour les fonctions moléculaires, seule l’activité catalytique agissant sur l’ARN et la liaison à l’ARN simple brin sont statistiquement enrichies. Pour les composants cellulaires, seul le complexe rétromère est statistiquement enrichi. Cette image représentative montre l’analyse d’enrichissement KEGG des gènes parentaux circRNA DE dans un diagramme de bulles.
Seuls deux termes KEGG ont été enrichis dans ce cas, la grippe A et les voies du cycle de vie virale. L’une des choses les plus importantes lors de la tentative de cette procédure est de s’assurer que le type de trait correct de l’ensemble de données circ ARN que vous utilisez lors de l’exécution d’une blessure. Le pipeline bio-formatique fourni ici aide à prédire les ARN laïques potentiels et les annotations fonctionnelles.
Cependant, une vérification bien menée sera toujours nécessaire pour fournir des preuves solides. Ce protocole permettra aux chercheurs de découvrir l’ARN sécurisé et leurs rôles fonctionnels potentiels dans les différents codes et interactions pathogènes, qu’ils pourront étudier plus avant.