Un abonnement à JoVE est nécessaire pour voir ce contenu. Connectez-vous ou commencez votre essai gratuit.
Le protocole soumis ici explique le pipeline in silico complet nécessaire pour prédire et caractériser fonctionnellement les circRNA à partir de données de transcriptome de séquençage de l’ARN étudiant les interactions hôte-pathogène.
Les ARN circulaires (circRNA) sont une classe d’ARN non codants qui sont formés par épissage arrière. Ces circRNA sont principalement étudiés pour leurs rôles de régulateurs de divers processus biologiques. Notamment, de nouvelles preuves démontrent que les circRNA de l’hôte peuvent être exprimés de manière différentielle (DE) lors de l’infection par des agents pathogènes (p. ex. grippe et coronavirus), ce qui suggère un rôle pour les ARNcirc dans la régulation des réponses immunitaires innées de l’hôte. Cependant, les recherches sur le rôle des circRNA lors d’infections pathogènes sont limitées par les connaissances et les compétences requises pour effectuer l’analyse bioinformatique nécessaire pour identifier les circRNA DE à partir des données de séquençage de l’ARN (RNA-seq). La prédiction bioinformatique et l’identification des circRNA sont cruciales avant toute vérification et études fonctionnelles utilisant des techniques de laboratoire humide coûteuses et longues. Pour résoudre ce problème, un protocole étape par étape de prédiction et de caractérisation in silico des circRNA à l’aide de données RNA-seq est fourni dans ce manuscrit. Le protocole peut être divisé en quatre étapes : 1) Prédiction et quantification des circRNA DE via le pipeline CIRIquant ; 2) Annotation via circBase et caractérisation des circRNAs DE; 3) Prédiction de l’interaction CircRNA-miARN par pipeline Circr; 4) analyse de l’enrichissement fonctionnel des gènes parentaux circRNA à l’aide de l’ontologie génique (GO) et de l’Encyclopédie des gènes et des génomes de Kyoto (KEGG). Ce pipeline sera utile pour mener de futures recherches in vitro et in vivo afin de mieux comprendre le rôle des circRNA dans les interactions hôte-pathogène.
Les interactions hôte-pathogène représentent une interaction complexe entre les agents pathogènes et les organismes hôtes, qui déclenche les réponses immunitaires innées des hôtes qui finissent par entraîner l’élimination des agents pathogènes envahisseurs 1,2. Au cours des infections pathogènes, une multitude de gènes immunitaires de l’hôte sont régulés pour inhiber la réplication et la libération d’agents pathogènes. Par exemple, les gènes communs stimulés par l’interféron (ISG) régulés sur les infections pathogènes comprennent ADAR1, IFIT1, IFIT2, IFIT3, ISG20, RIG-I et OASL 3,4. Outre les gènes codant pour les protéines, des études ont également rapporté que les ARN non codants tels que les longs ARN non codants (ARNnc), les microARN (miARN) et les ARN circulaires (ARNcirc) jouent également un rôle et sont régulés simultanément lors d’infections pathogènes 5,6,7. Contrairement aux gènes codant pour des protéines qui codent principalement des protéines en tant que molécules fonctionnelles, les ARN non codants (ARNnc) sont connus pour fonctionner comme régulateurs des gènes aux niveaux transcriptionnel et post-transcriptionnel. Cependant, les études impliquant la participation d’ARN non codants, en particulier les circRNA, dans la régulation des gènes immunitaires des hôtes ne sont pas bien rapportées par rapport aux gènes codant pour les protéines.
Les circRNA sont largement caractérisés par leur structure de boucle continue fermée par covalence, qui est générée par un processus d’épissage non canonique appelé back-sprisage8. Le processus d’épissage arrière, contrairement au processus d’épissage des ARN linéaires apparentés, implique la ligature du site donneur en aval vers le site accepteur en amont, formant une structure de forme circulaire. Actuellement, trois mécanismes différents d’épissage inverse pour la biogenèse des circRNAs ont été proposés. Il s’agit de la circularisation médiée par la protéine de liaison à l’ARN(RBP) 9,10, de la circularisation induite par l’appariement d’introns 11 et de la circularisation induite par le lariat12,13,14. Étant donné que les circRNA sont connectés bout à bout dans une structure circulaire, ils ont tendance à être naturellement résistants aux digestions normales des exonucléases et, par conséquent, sont considérés comme plus stables que leurs homologues linéaires15. Une autre caractéristique commune présentée par les circRNA comprend l’expression spécifique au type de cellule ou de tissu chez les hôtes16.
Comme l’impliquent leur structure unique et leur expression spécifique à la cellule ou au tissu, on a découvert que les circRNA jouent des fonctions biologiques importantes dans les cellules. À ce jour, l’une des fonctions importantes des circRNA est leur rôle en tant qu’éponges de microARN (miARN)17,18. Ce rôle régulateur des circRNA se produit par la liaison complémentaire des nucléotides circRNA avec la région semencière des miARN. Une telle interaction circRNA-miARN inhibe les fonctions régulatrices normales des miARN sur les ARNm cibles, régulant ainsi l’expression des gènes19,20. De plus, les circRNA sont également connus pour réguler l’expression des gènes en interagissant avec les protéines de liaison à l’ARN (RBP) et en formant des complexes ARN-protéine21. Bien que les circRNA soient classés comme ARN non codants, il existe également des preuves que les circRNA peuvent servir de modèles pour la traduction des protéines22,23,24.
Récemment, il a été démontré que les circRNA jouent un rôle central dans la régulation des interactions hôte-pathogène, en particulier entre les hôtes et les virus. En général, les circRNA de l’hôte sont supposés aider à réguler les réponses immunitaires de l’hôte pour éliminer les agents pathogènes envahisseurs. Un exemple de circRNA qui favorise les réponses immunitaires de l’hôte est circRNA_0082633, rapporté par Guo et al.25. Ce circRNA améliore la signalisation de l’interféron de type I (IFN) dans les cellules A549, ce qui aide à supprimer la réplication du virus de la grippe25. De plus, Qu et al. ont également signalé un circRNA intronique humain, appelé circRNA AIVR, qui favorise l’immunité en régulant l’expression de la protéine de liaison CREB (CREBBP), un transducteur de signal de l’IFN-β26,27. Cependant, il existe également des circRNA connus pour favoriser la pathogenèse de la maladie lors de l’infection. Par exemple, Yu et al. ont récemment rapporté le rôle joué par un circRNA épissé à partir du domaine du doigt de zinc GATA contenant le gène 2A (circGATAD2A) dans la promotion de la réplication du virus H1N1 par l’inhibition de l’autophagie de la cellule hôte28.
Pour étudier efficacement les circRNA, un algorithme de prédiction circRNA à l’échelle du génome est généralement mis en œuvre, suivi d’une caractérisation in silico des candidats circRNA prédits avant que toute étude fonctionnelle puisse être réalisée. Une telle approche bioinformatique pour prédire et caractériser les circRNA est moins coûteuse et plus rapide. Il aide à affiner le nombre de candidats à étudier fonctionnellement et pourrait potentiellement conduire à de nouvelles découvertes. Ici, nous fournissons un protocole bioinformatique détaillé pour l’identification in silico , la caractérisation et l’annotation fonctionnelle des circRNA au cours des interactions hôte-pathogène. Le protocole comprend l’identification et la quantification des circRNA à partir d’ensembles de données de séquençage d’ARN, l’annotation via circBase et la caractérisation des candidats circRNA en termes de types circRNA, de nombre de gènes qui se chevauchent et d’interactions circRNA-miARN prévues. Cette étude fournit également l’annotation fonctionnelle des gènes parentaux circRNA par le biais de l’ontologie génique (GO) et de l’analyse d’enrichissement de l’Encyclopédie des gènes et des génomes de Kyoto (KEGG).
Dans ce protocole, des ensembles de données de bibliothèque de séquençage d’ARN ribosomique (ARNr) appauvris en ARN dépersonnalisés, préparés à partir de cellules de macrophages humains infectées par le virus de la grippe A, ont été téléchargés et utilisés à partir de la base de données GEO (Gene Expression Omnibus). L’ensemble du pipeline bioinformatique, de la prédiction à la caractérisation fonctionnelle des circRNA, est résumé à la figure 1. Chaque partie du pipeline est expliquée plus en détail dans les sections ci-dessous.
1. Préparation, téléchargement et configuration avant l’analyse des données
NOTE: Tous les progiciels utilisés dans cette étude sont gratuits et open-source.
2. Prédiction et analyse d’expression différentielle des circRNA à l’aide de CIRIquant
REMARQUE : Un manuel plus détaillé sur l’installation et l’exécution de l’analyse d’expression différentielle se trouve dans la section disponibilité du code du document CIRIquant31. Les données supplémentaires incluent également certaines des commandes de base utilisées dans ce protocole.
3. Caractérisation et annotation des circRNAs DE prédits
4. Prédire l’interaction circRNA-miARN à l’aide de Circr
REMARQUE: Un manuel plus détaillé sur la façon d’installer et d’utiliser Circr pour l’analyse de l’interaction circRNA-miARN peut être trouvé à: https://github.com/bicciatolab/Circr37.
5. Construction du réseau ceRNA
REMARQUE: Un manuel détaillé sur la façon d’utiliser Cytoscape peut être trouvé à: http://manual.cytoscape.org/en/stable/ et https://github.com/cytoscape/cytoscape-tutorials/wiki#introduction
6. Analyse de l’enrichissement fonctionnel
Le protocole enrôlé dans la section précédente a été modifié et configuré pour s’adapter au système d’exploitation Linux. La raison principale est que la plupart des bibliothèques de modules et des paquets impliqués dans l’analyse des circRNA ne peuvent fonctionner que sur la plate-forme Linux. Dans cette analyse, des ensembles de données de bibliothèques de séquences d’ARN ribosomique (ARNr) appauvries en ARN dépersonnalisées préparées à partir des cellules de macrophages humains infectées pa...
Pour illustrer l’utilité de ce protocole, le séquençage de l’ARN provenant de cellules de macrophages humains infectées par le virus de la grippe A a été utilisé comme exemple. Les circRNA fonctionnant comme des éponges miARN potentielles dans les interactions hôte-pathogène et leur enrichissement fonctionnel GO et KEGG au sein d’un hôte ont été étudiés. Bien qu’il existe une variété d’outils circRNA disponibles en ligne, chacun d’eux est un package autonome qui n’interagit pas les uns avec...
Les auteurs n’ont rien à divulguer.
L’auteur tient à remercier Tan Ke En et le Dr Cameron Bracken pour leur examen critique de ce manuscrit. Ce travail a été soutenu par des subventions du programme de subventions de recherche fondamentale (FRGS / 1 / 2020 / SKK0 / UM / 02/15) et de la subvention de recherche à fort impact de l’Université de Malaisie (UM. C/625/1/HIR/MOE/CHAN/02/07).
Name | Company | Catalog Number | Comments |
Bedtools | GitHub | https://github.com/arq5x/bedtools2/ | Referring to section 4.1.2. Needed for Circr. |
BWA | Burrows-Wheeler Aligner | http://bio-bwa.sourceforge.net/ | Referring to section 2.1.1 and 2.1.2. Needed to run CIRIquant, and to index the genome |
Circr | GitHub | https://github.com/bicciatolab/Circr | Referring to section 4. Use to predict the miRNA binding sites |
CIRIquant | GitHub | https://github.com/bioinfo-biols/CIRIquant | Referring to section 2.1.3. To predict circRNAs |
Clusterprofiler | GitHub | https://github.com/YuLab-SMU/clusterProfiler | Referring to section 7. For GO and KEGG functional enrichment |
CPU | Intel | Intel(R) Xeon(R) CPU E5-2620 V2 @ 2.10 GHz Cores: 6-core CPU Memory: 65 GB Graphics card: NVIDIA GK107GL (QUADRO K2000) | Specifications used to run this entire protocol. |
Cytoscape | Cytoscape | https://cytoscape.org/download.html | Referring to section 5.2. Needed to plot ceRNA network |
FastQC | Babraham Bioinformatics | https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ | Referring to section 1.2.1. Quality checking on Fastq files |
HISAT2 | http://daehwankimlab.github.io/hisat2/ | Referring to section 2.1.1 and 2.1.2. Needed to run CIRIquant, and to index the genome | |
Linux | Ubuntu 20.04.5 LTS (Focal Fossa) | https://releases.ubuntu.com/focal/ | Needed to run the entire protocol. Other Ubuntu versions may still be valid to carry out the protocol. |
miRanda | http://www.microrna.org/microrna/getDownloads.do | Referring to section 4.1.2. Needed for Circr | |
Pybedtools | pybedtools 0.8.2 | https://pypi.org/project/pybedtools/ | Needed for BED file genomic manipulation |
Python | Python 2.7 and 3.6 or abover | https://www.python.org/downloads/ | To run necessary library modules |
R | The Comprehensive R Archive Network | https://cran.r-project.org/ | To manipulate dataframes |
RNAhybrid | BiBiServ | https://bibiserv.cebitec.uni-bielefeld.de/rnahybrid | Referring to section 4.1.2. Needed for Circr |
RStudio | RStudio | https://www.rstudio.com/ | A workspace to run R |
samtools | SAMtools | http://www.htslib.org/ | Referring to section 2.1.2. Needed to run CIRIquant |
StringTie | Johns Hopkins University: Center for Computational Biology | http://ccb.jhu.edu/software/stringtie/index.shtml | Referring to section 2.1.2. Needed to run CIRIquant |
TargetScan | GitHub | https://github.com/nsoranzo/targetscan | Referring to section 4.1.2. Needed for Circr |
Demande d’autorisation pour utiliser le texte ou les figures de cet article JoVE
Demande d’autorisationExplorer plus d’articles
This article has been published
Video Coming Soon