Entrar

É necessária uma assinatura da JoVE para visualizar este conteúdo. Faça login ou comece sua avaliação gratuita.

Neste Artigo

  • Resumo
  • Resumo
  • Introdução
  • Protocolo
  • Resultados
  • Discussão
  • Divulgações
  • Agradecimentos
  • Materiais
  • Referências
  • Reimpressões e Permissões

Resumo

O protocolo apresentado aqui explica o pipeline in silico completo necessário para prever e caracterizar funcionalmente circRNAs a partir de dados de transcriptoma de sequenciamento de RNA estudando interações patógeno-hospedeiro.

Resumo

RNAs circulares (circRNAs) são uma classe de RNAs não-codificantes que são formados via back-splicing. Estes circRNAs são predominantemente estudados por seus papéis como reguladores de vários processos biológicos. Notavelmente, evidências emergentes demonstram que circRNAs do hospedeiro podem ser diferencialmente expressos (DE) após a infecção por patógenos (por exemplo, influenza e coronavírus), sugerindo um papel para circRNAs na regulação das respostas imunes inatas do hospedeiro. No entanto, as investigações sobre o papel dos circRNAs durante infecções patogênicas são limitadas pelo conhecimento e habilidades necessárias para realizar a análise bioinformática necessária para identificar circRNAs DE a partir de dados de sequenciamento de RNA (RNA-seq). A predição bioinformática e a identificação de circRNAs são cruciais antes de qualquer verificação, e estudos funcionais usando técnicas de laboratório úmido caras e demoradas. Para resolver essa questão, um protocolo passo-a-passo de predição e caracterização in silico de circRNAs usando dados de RNA-seq é fornecido neste manuscrito. O protocolo pode ser dividido em quatro etapas: 1) Predição e quantificação de circRNAs DE via pipeline CIRIquant; 2) Anotação via circBase e caracterização de circRNAs DE; 3) Predição da interação CircRNA-miRNA através do pipeline Circr; 4) análise de enriquecimento funcional de genes parentais de circRNA usando Ontologia Gênica (GO) e Enciclopédia de Genes e Genomas de Kyoto (KEGG). Este pipeline será útil na condução de futuras pesquisas in vitro e in vivo para desvendar ainda mais o papel dos circRNAs nas interações patógeno-hospedeiro.

Introdução

As interações patógeno-hospedeiro representam uma complexa interação entre os patógenos e os organismos hospedeiros, que desencadeia as respostas imunes inatas dos hospedeiros que, eventualmente, resultam na remoção de patógenos invasores 1,2. Durante infecções patogênicas, uma infinidade de genes imunes do hospedeiro é regulada para inibir a replicação e liberação de patógenos. Por exemplo, genes comuns estimulados por interferon (ISGs) regulados sobre infecções patogênicas incluem ADAR1, IFIT1, IFIT2, IFIT3, ISG20, RIG-I e OASL 3,4. Além dos genes codificadores de proteínas, estudos também relataram que RNAs não codificantes, como RNAs longos não codificadores (lncRNAs), microRNAs (miRNAs) e circulares (circRNAs), também desempenham um papel e são regulados concomitantemente durante infecções patogênicas 5,6,7. Em contraste com os genes codificadores de proteínas que codificam principalmente proteínas como moléculas funcionais, RNAs não-codificantes (ncRNAs) são conhecidos por funcionar como reguladores de genes em níveis transcricionais e pós-transcricionais. No entanto, estudos envolvendo a participação de RNAs não-codificantes, particularmente circRNAs, na regulação dos genes imunes dos hospedeiros não são bem relatados em comparação com os genes codificadores de proteínas.

Os circRNAs são amplamente caracterizados por sua estrutura de loop contínuo covalentemente fechado, que é gerado através de um processo de splicing não-canônico chamado back-splicing8. O processo de back-splicing, ao contrário do processo de splicing de RNAs lineares cognatos, envolve a ligadura do sítio doador a jusante ao sítio receptor a montante, formando uma estrutura de forma circular. Atualmente, três diferentes mecanismos de back-splicing para a biogênese de circRNAs têm sido propostos. Estas são a circularização mediada por RNA binding protein (RBP) 9,10, a circularização conduzida por intron-pairing 11 e a circularização conduzida por lariat12,13,14. Dado que os circRNAs estão conectados de ponta a ponta em uma estrutura circular, eles tendem a ser naturalmente resistentes às digestãos normais de exonucleases e, portanto, são considerados mais estáveis do que seus equivalentes lineares15. Outra característica comum exibida pelos circRNAs inclui a expressão específica do tipo celular ou tecidual em hospedeiros16.

Como implicado por sua estrutura única e expressão célula ou tecido-específica, circRNAs foram descobertos para desempenhar funções biológicas importantes nas células. Até o momento, uma das funções proeminentes dos circRNAs é seu papel como esponjas de microRNA (miRNA)17,18. Este papel regulatório dos circRNAs ocorre através da ligação complementar dos nucleotídeos do circRNA com a região da semente dos miRNAs. Esta interação circRNA-miRNA inibe as funções regulatórias normais dos miRNAs sobre os RNAm-alvo, regulando assim a expressão de genes 19,20. Além disso, circRNAs também são conhecidos por regular a expressão gênica interagindo com proteínas ligadoras de RNA (RBPs) e formando complexos RNA-proteína21. Embora os circRNAs sejam classificados como RNAs não codificantes, também há evidências de que os circRNAs podem atuar como moldes para a tradução deproteínas22,23,24.

Recentemente, foi demonstrado que os circRNAs desempenham papéis fundamentais na regulação das interações patógeno-hospedeiro, particularmente entre os hospedeiros e os vírus. Geralmente, acredita-se que os circRNAs do hospedeiro auxiliem na regulação das respostas imunes do hospedeiro para eliminar os patógenos invasores. Um exemplo de circRNA que promove respostas imunes do hospedeiro é circRNA_0082633, relatado por Guo et al.25. Esse circRNA aumenta a sinalização do interferon tipo I (IFN) dentro das células A549, o que ajuda a suprimir a replicação do vírus influenza25. Além disso, Qu e col. também relataram um circRNA intrônico humano, denominado circRNA AIVR, que promove imunidade regulando a expressão da proteína ligadora de CREB (CREBBP), um transdutor de sinal de IFN-β26,27. No entanto, circRNAs que são conhecidos por promover a patogênese da doença após a infecção também existem. Por exemplo, Yu e col. relataram recentemente o papel desempenhado por um circRNA emendado do domínio dedo de zinco GATA contendo o gene 2A (circGATAD2A) na promoção da replicação do vírus H1N1 através da inibição da autofagia da célula hospedeira28.

Para estudar efetivamente circRNAs, um algoritmo de predição de circRNA genômico é geralmente implementado, seguido por uma caracterização in silico dos candidatos a circRNA previstos antes que qualquer estudo funcional possa ser realizado. Tal abordagem de bioinformática para prever e caracterizar circRNAs é menos dispendiosa e mais eficiente em termos de tempo. Isso ajuda a refinar o número de candidatos a serem estudados funcionalmente e pode potencialmente levar a novas descobertas. Aqui, nós fornecemos um protocolo detalhado baseado em bioinformática para a identificação, caracterização e anotação funcional in silico de circRNAs durante as interações patógeno-hospedeiro. O protocolo inclui a identificação e quantificação de circRNAs a partir de conjuntos de dados de sequenciamento de RNA, anotação via circBase e a caracterização dos candidatos de circRNA em termos de tipos de circRNA, número de genes sobrepostos e interações circRNA-miRNA previstas. Este estudo também fornece a anotação funcional dos genes parentais do circRNA através da análise de enriquecimento da Gene Ontology (GO) e da Enciclopédia de Genes e Genomas de Kyoto (KEGG).

Protocolo

Neste protocolo, conjuntos de dados da biblioteca RNA-seq depletada de RNA-rribossomal desidentificados preparados a partir de células de macrófagos humanos infectadas pelo vírus influenza A foram baixados e usados do banco de dados Gene Expression Omnibus (GEO). Todo o pipeline de bioinformática, desde a predição até a caracterização funcional dos circRNAs, está resumido na Figura 1. Cada parte do gasoduto é explicada mais detalhadamente nas seções abaixo.

1. Preparação, download e configuração antes da análise dos dados

NOTA: Todos os pacotes de software utilizados neste estudo são gratuitos e de código aberto.

  1. Baixando as ferramentas necessárias na plataforma Linux
    1. Baixe e instale o software e as ferramentas necessárias listados na Tabela de Materiais em um computador Linux de alto desempenho usando as instruções fornecidas pelo desenvolvedor.
      NOTA: A maioria das ferramentas e software tem suas próprias páginas online do GitHub ou documentação contendo instruções sobre como instalar e usar suas ferramentas (consulte a Tabela de Materiais).
    2. Faça o download dos conjuntos de dados RNA-seq desejados para detecção e análise de circRNA em sites de arquivos de sequências (por exemplo, European Nucleotides Archive e Gene Expression Omnibus).
    3. Faça o download do(s) genoma(s) de referência (formato FASTA) e dos arquivos de anotação (formato GTF/GFF3), compatíveis com o hospedeiro a partir do qual o conjunto de dados RNA-seq foi preparado. Genoma(s) de referência do hospedeiro e arquivos de anotação são geralmente encontrados em navegadores de genoma on-line, como o National Center for Biotechnology Information (NCBI), a Universidade da Califórnia em Santa Cruz (UCSC) e os sites do Ensembl.
  2. Verificação da qualidade do RNA-seq
    1. Insira os arquivos FASTQ no programa FASTQC para determinar a qualidade das sequências de RNA. Se a qualidade dos arquivos FASTQ for baixa (por exemplo, 29,30.

2. Predição e análise de expressão diferencial de circRNAs utilizando CIRIquant

NOTA: Um manual mais detalhado sobre como instalar e executar a análise de expressão diferencial pode ser encontrado na seção de disponibilidade de código do documento CIRIquant31. Os dados complementares também incluem alguns dos comandos básicos usados neste protocolo.

  1. Previsões de CircRNA
    1. Indexe o genoma de referência do hospedeiro primeiro usando alinhadores BWA e HISAT2. Em seguida, em um terminal Linux, execute os comandos bwa index 32 e hisat2-build33 no diretório do genoma de referência do host para indexá-lo.
    2. Em seguida, prepare um arquivo de configuração YML contendo o nome do arquivo, o caminho das ferramentas (BWA, HISAT2, stringtie34, samtools35), o caminho para os arquivos de referência baixados (arquivos FASTA do genoma de referência do host, arquivos de anotação) e o caminho para os arquivos de índice da etapa 2.1.1.
    3. Execute a ferramenta CIRIquant a partir do terminal usando os parâmetros padrão ou manuais. O usuário pode especificar o tipo de biblioteca (encalhada ou não encalhada) dos dados RNA-seq ao executar a ferramenta CIRIquant.
      NOTA: O tipo de biblioteca dos dados RNA-seq pode ser determinado conhecendo o tipo de kit de preparação de biblioteca usado. Se a identidade do kit de preparação da biblioteca for desconhecida, um pacote de bioinformática de controle de RNA-seq chamado RSeQC36 pode ser usado para determinar o encalhe de dados de RNA-seq.
  2. Análise de expressão diferencial
    NOTA: O pacote CIRIquant inclui prep_CIRIquant, prepDE.py e CIRI_DE_replicate; portanto, nenhum download adicional é necessário para essas três ferramentas.
    1. Prepare um arquivo de texto (.lst) com uma lista de dados contendo o seguinte:
      coluna: IDs dos dados RNA-seq utilizados na etapa 2.1.3
      coluna: caminho para os arquivos GTF gerados pelo CIRIquant
      coluna: agrupamento dos dados de RNA-seq, se é um grupo controle ou tratado.
    2. Para obter um exemplo, consulte a Tabela 1 abaixo.
      NOTA: Não é necessário colocar os cabeçalhos, pois eles são apenas para referência.
    3. No terminal Linux, execute prep_CIRIquant com o arquivo de texto (.lst) preparado na etapa 2.2.1 como uma entrada. A execução gerará uma lista de arquivos: library_info.csv, circRNA_info.csv, circRNA_bsj.csv e circRNA_ratio.csv.
    4. Prepare um segundo arquivo de texto com uma lista de dados contendo os IDs RNA-seq e o caminho para sua respectiva saída StringTie. O layout do arquivo deve ser semelhante ao arquivo de texto na etapa 2.2.1 sem a coluna de agrupamento.
    5. Execute prepDE.py com o arquivo de texto preparado na etapa 2.2.4 como uma entrada para gerar os arquivos de matriz de contagem de genes.
    6. Execute CIRI_DE_replicate com os arquivos library_info.csv e circRNA_bsj.csv da etapa 2.2.3 e o arquivo gene_count_matrix.csv da etapa 2.2.5 como entradas para gerar o arquivo circRNA_de.tsv final.
  3. Filtragem de circRNAs DE
    1. Use R (no terminal do computador ou RStudio) ou qualquer software de planilha (por exemplo, Microsoft Excel) para abrir o arquivo circRNA_de.tsv gerado a partir da etapa 2.2.6 para filtrar e determinar o número de circRNAs diferencialmente expressos (DE).
    2. Filtrar os circRNAs DE de acordo com os critérios LogFC > |2| e FDR < 0,05.
    3. Crie um arquivo chamado DE_circRNAs.txt para armazenar as informações de circRNAs DE.

3. Caracterização e anotação de circRNAs DE previstos

  1. Status de anotação de circRNAs DE
    1. Carregue o arquivo chamado DE_circRNAs.txt no RStudio , que consiste na lista de circRNAs DE filtrados da etapa 2.3.3. Inclua outras informações, como as posições genômicas (Chr, Start, End), orientações de fita (+ ou -), nome do gene e tipo de circRNA. Antes de prosseguir, converta as coordenadas iniciais genômicas do circRNA de CIRIquant para 0-based subtraindo 1 par de bases.
      NOTA: As outras informações indicadas acima podem ser obtidas a partir dos arquivos GTF gerados pelo CIRIquant (Arquivo Suplementar 1).
    2. Determine o status de anotação dos circRNAs DE previstos baixando uma biblioteca contendo as posições genômicas do circRNA-banco de dados (por exemplo, circBase) depositado circRNAs.
      NOTA: Certifique-se de que a versão do genoma usada para prever os circRNAs é idêntica à biblioteca de banco de dados circRNA antes de fazer a comparação. O arquivo de dados circBase usado aqui está disponível gratuitamente na pasta da unidade fornecida no Github (https://github.com/bicciatolab/Circr)37.
    3. Depois que os arquivos da etapa 3.1.1 e da etapa 3.1.2 estiverem preparados, execute o script R fornecido no Arquivo Suplementar 1. Os locais cromossômicos dos circRNAs DE são consultados na biblioteca antes de atribuir o status Anotado ou Não Anotado.
  2. Caracterização de circRNAs DE
    1. Use R e outros softwares de planilha para resumir o número de circRNAs de acordo com os tipos de circRNA (ou seja, éxon, intron, intergênico e antisense) e o número de genes que os circRNAs abrangem (1 ou >1) (Arquivo Suplementar 1).NOTA: CIRIquant só pode detectar quatro tipos de circRNAs (éxon, intron, intergênico e antisense). Os circRNAs exon-íntron, também conhecidos como ElciRNAs, não podem ser detectados pelo CIRIquant.

4. Predição da interação circRNA-miRNA usando Circr

NOTA: Um manual mais detalhado sobre como instalar e usar o Circr para a análise da interação circRNA-miRNA pode ser encontrado em: https://github.com/bicciatolab/Circr37.

  1. Preparação de arquivos
    1. Descompacte e extraia o conteúdo do arquivo Circr.zip depois de baixá-lo da página do Circr GitHub usando o software relevante, como "WinRar" ou "7-zip" em um novo diretório onde a análise será conduzida.
    2. Instale os aplicativos de software de pré-requisito (miRanda, RNAhybrid, Pybedtools e samtools) antes de realizar a análise circRNA-miRNA.
    3. Genomas de referência e arquivos de anotação para vários organismos de interesse, arquivo de coordenadas de rRNA, arquivo de interação de miRNA validado e arquivos circBase circRNA são fornecidos pelo autor do Circr na página do Github (https://github.com/bicciatolab/Circr)37. Ao clicar nos arquivos de suporte na pasta da unidade, selecione a pasta do organismo de interesse, a pasta miRNA e o arquivo de texto circBase e faça o download.
    4. Depois de baixar os arquivos necessários na etapa 4.1.3, crie um novo diretório chamado support_files no diretório mencionado na etapa 4.1.1. Em seguida, descompacte e extraia o conteúdo no diretório support_files .
    5. Indexar o arquivo genômico de referência do organismo de interesse usando o comando samtools faidx (Arquivo Suplementar 1).
    6. Prepare um arquivo de entrada que consista nas coordenadas dos circRNAs DE de interesse em um arquivo BED delimitado por tabulações, conforme mostrado na Tabela 2.
      NOTA: Como os circRNAs previstos pelo CIRIquant não são baseados em 0, é necessário menos 1 pb na coordenada inicial (conforme mencionado na etapa 3.1.1) antes de convertê-los para o formato BED. Os cabeçalhos mostrados na Tabela 2 são apenas para referência e não são necessários nos arquivos BED.
    7. Neste ponto, verifique se a estrutura de árvore de pastas esperada para a análise do Circr é como na Figura 2.
  2. Executando Circr.py
    1. Execute Circr.py usando Python 3 e, como argumentos, especifique o arquivo de entrada circRNA, o genoma FASTA do organismo de interesse, a versão do genoma do organismo selecionado, o número de threads e o nome do arquivo de saída na linha de comando.
    2. Se o organismo de interesse não for fornecido na pasta da unidade listada na etapa 4.1.3 ou se o usuário preferir ter um conjunto personalizado de arquivos para executar a análise, comandos adicionais especificando o local desses arquivos precisam ser incluídos ao executar Circr.py.
    3. Após a conclusão da análise do Circr, o programa emite um arquivo de interação circRNA-miRNA no formato csv.
    4. Filtrar os resultados da interação circRNA-miRNA de acordo com a preferência específica do usuário. Para este estudo, as previsões são filtradas usando o Rstudio de acordo com os critérios abaixo:
      -Detectado por todas as três ferramentas de software
      -Dois ou mais sites de ligação reportados pelo Targetscan e pelo miRanda
      -Identificado nas colunas "AGO" ou "validado"
      -Filtre nenhuma interação da região da semente
    5. Escreva os circRNAs que passam as condições filtradas da etapa 4.2.3 em um novo arquivo de texto chamado circRNA_miRNA.txt. Essa filtragem pode aumentar a confiança das interações previstas.

5. Construção da rede de ceRNA

NOTA: Um manual detalhado sobre como usar o Cytoscape pode ser encontrado em: http://manual.cytoscape.org/en/stable/ e https://github.com/cytoscape/cytoscape-tutorials/wiki#introduction

  1. Download e preparação
    1. Baixe a última versão do Cytoscape38 em: https://cytoscape.org/download.html.
    2. Execute o assistente do instalador baixado na etapa 5.1.1 e selecione o local do arquivo para o software Cytoscape.
    3. Prepare um arquivo delimitado por tabulações contendo os circRNAs de interesse e seus miRNAs alvo. A primeira coluna consiste no nome circRNA; a segunda coluna especifica o tipo de ARN da primeira coluna; a terceira coluna é o miRNA alvo; e a quarta coluna especifica o tipo de RNA da terceira coluna. Um exemplo do arquivo é mostrado na Tabela 3.
  2. Construindo o mapa da rede ceRNA
    1. Abra o software Cytoscape instalado na etapa 5.1.2.
    2. No Cytoscape, navegue até Arquivo > Importar > rede do arquivo. Selecione o arquivo que foi preparado na etapa 5.1.3.
    3. Na nova guia, selecione a primeira e a segunda coluna como "Nó de origem" e "Atributo do nó de origem", enquanto selecione a terceira e a quarta coluna como "Nó de destino" e "Atributo de nó de destino", respectivamente. Clique em OK e a rede aparecerá no lado superior direito do Cytoscape.
    4. Para alterar o estilo visual da rede, pressione o botão Estilo no lado esquerdo do Cytoscape.
    5. Pressione a seta no lado direito de Cor de preenchimento. Escolha Tipo para a coluna e Mapeamento discreto para o tipo de mapeamento. Em seguida, selecione a cor desejada para cada um dos tipos de RNA.
    6. Depois de alterar a cor, altere a forma dos nós navegando até Forma e seguindo a etapa 5.2.5.

6. Análise do enriquecimento funcional

  1. Análise de Ontologia Gênica (GO) e Enciclopédia de Genes e Genomas de Kyoto (KEGG) para o gene parental dos circRNAs
    1. Certifique-se do clusterProfiler 39,40 e org. Hs.eg.db41 pacotes foram instalados no Rstudio. A organização. Hs.eg.dbpacote 41 é um pacote de anotação de genoma apenas para humanos. Se o organismo de interesse for outra espécie, consulte: https://bioconductor.org/packages/release/BiocViews.html#OrgDb
    2. Importe as informações DE_circRNA da etapa 2.3.1 para o espaço de trabalho do Rstudio.
    3. Use o gene parental dos circRNAs fornecidos neste arquivo para análise de enriquecimento nas próximas etapas. No entanto, se o usuário deseja converter o símbolo do gene para outros formatos, como o ID de Entrez, use uma função como "bitr".
    4. Usando o ID do gene como entrada, execute a análise de enriquecimento GO usando a função enrichGO dentro do pacote clusterProfiler39,40 usando parâmetros padrão.
    5. Usando o ID do gene como entrada, execute a análise de enriquecimento KEGG usando a função enrichKEGG dentro do pacote clusterProfiler39,40 usando os parâmetros padrão.

Resultados

O protocolo alistado na seção anterior foi modificado e configurado para se adequar ao sistema operacional Linux. A principal razão é que a maioria das bibliotecas de módulos e pacotes envolvidos na análise de circRNAs só podem funcionar na plataforma Linux. Nesta análise, conjuntos de dados da biblioteca RNA-seq depletada de RNA-seq de RNA ribossomal não identificados, preparados a partir de células de macrófagos humanos infectadas pelo vírus Influenza A, foram baixados do banco de dados GEO

Discussão

Para ilustrar a utilidade deste protocolo, RNA-seq de células de macrófagos humanos infectadas pelo vírus influenza A foi usado como exemplo. CircRNAs funcionando como potenciais esponjas de miRNA em interações patógeno-hospedeiro e seu enriquecimento funcional GO e KEGG dentro de um hospedeiro foram investigados. Embora haja uma variedade de ferramentas circRNA disponíveis on-line, cada uma delas é um pacote autônomo que não interage entre si. Aqui, reunimos algumas das ferramentas necessárias para predição...

Divulgações

Os autores não têm nada a revelar.

Agradecimentos

O autor gostaria de agradecer a Tan Ke En e ao Dr. Cameron Bracken pela revisão crítica deste manuscrito. Este trabalho foi apoiado por bolsas do Fundamental Research Grant Scheme (FRGS/1/2020/SKK0/UM/02/15) e University of Malaya High Impact Research Grant (UM. C/625/1/HIR/MOE/CHAN/02/07).

Materiais

NameCompanyCatalog NumberComments
BedtoolsGitHubhttps://github.com/arq5x/bedtools2/Referring to section 4.1.2. Needed for Circr.
BWABurrows-Wheeler Alignerhttp://bio-bwa.sourceforge.net/Referring to section 2.1.1 and 2.1.2. Needed to run CIRIquant, and to index the genome
CircrGitHubhttps://github.com/bicciatolab/CircrReferring to section 4. Use to predict the miRNA binding sites
CIRIquantGitHubhttps://github.com/bioinfo-biols/CIRIquantReferring to section 2.1.3. To predict circRNAs
ClusterprofilerGitHubhttps://github.com/YuLab-SMU/clusterProfilerReferring to section 7. For GO and KEGG functional enrichment
CPUIntel Intel(R) Xeon(R) CPU E5-2620 V2 @ 2.10 GHz   Cores: 6-core CPU Memory: 65 GB Graphics card: NVIDIA GK107GL (QUADRO K2000) Specifications used to run this entire protocol.
CytoscapeCytoscapehttps://cytoscape.org/download.htmlReferring to section 5.2. Needed to plot ceRNA network
FastQCBabraham Bioinformaticshttps://www.bioinformatics.babraham.ac.uk/projects/fastqc/Referring to section 1.2.1. Quality checking on Fastq files
HISAT2http://daehwankimlab.github.io/hisat2/Referring to section 2.1.1 and 2.1.2. Needed to run CIRIquant, and to index the genome
LinuxUbuntu 20.04.5 LTS (Focal Fossa)https://releases.ubuntu.com/focal/Needed to run the entire protocol. Other Ubuntu versions may still be valid to carry out the protocol.
miRandahttp://www.microrna.org/microrna/getDownloads.doReferring to section 4.1.2. Needed for Circr
Pybedtoolspybedtools 0.8.2https://pypi.org/project/pybedtools/Needed for BED file genomic manipulation
PythonPython 2.7 and 3.6 or aboverhttps://www.python.org/downloads/To run necessary library modules
RThe Comprehensive R Archive Networkhttps://cran.r-project.org/To manipulate dataframes
RNAhybridBiBiServhttps://bibiserv.cebitec.uni-bielefeld.de/rnahybridReferring to section 4.1.2. Needed for Circr
RStudioRStudiohttps://www.rstudio.com/A workspace to run R
samtools SAMtoolshttp://www.htslib.org/Referring to section 2.1.2. Needed to run CIRIquant
StringTieJohns Hopkins University: Center for Computational Biologyhttp://ccb.jhu.edu/software/stringtie/index.shtmlReferring to section 2.1.2. Needed to run CIRIquant
TargetScanGitHubhttps://github.com/nsoranzo/targetscanReferring to section 4.1.2. Needed for Circr

Referências

  1. Raman, K., Bhat, A. G., Chandra, N. A systems perspective of host-pathogen interactions: predicting disease outcome in tuberculosis. Molecular BioSystems. 6 (3), 516-530 (2010).
  2. Casadevall, A., Pirofski, L. A. Host-pathogen interactions: basic concepts of microbial commensalism, colonization, infection, and disease. Infection and Immunity. 68 (12), 6511-6518 (2000).
  3. Yang, E., Li, M. M. H. All About the RNA: Interferon-stimulated genes that interfere with viral RNA processes. Frontiers in Immunology. 11, 605024 (2020).
  4. Schneider, W. M., Chevillotte, M. D., Rice, C. M. Interferon-stimulated genes: A complex web of host defenses. Annual Review of Immunology. 32 (1), 513-545 (2014).
  5. Shirahama, S., Miki, A., Kaburaki, T., Akimitsu, N. Long non-coding RNAs involved in pathogenic infection. Frontiers in Genetics. 11, 454 (2020).
  6. Chandan, K., Gupta, M., Sarwat, M. Role of host and pathogen-derived microRNAs in immune regulation during infectious and inflammatory diseases. Frontiers in Immunology. 10, 3081 (2019).
  7. Chen, X., et al. Circular RNAs in immune responses and immune diseases. Theranostics. 9 (2), 588-607 (2019).
  8. Kristensen, L. S., et al. The biogenesis, biology and characterization of circular RNAs. Nature Reviews Genetics. 20 (11), 675-691 (2019).
  9. Ashwal-Fluss, R., et al. circRNA biogenesis competes with pre-mRNA splicing. Molecular Cell. 56 (1), 55-66 (2014).
  10. Conn, S. J., et al. The RNA binding protein quaking regulates formation of circRNAs. Cell. 160 (6), 1125-1134 (2015).
  11. Zhang, X. O., et al. Complementary sequence-mediated exon circularization. Cell. 159 (1), 134-147 (2014).
  12. Robic, A., Demars, J., Kuhn, C. In-depth analysis reveals production of circular RNAs from non-coding sequences. Cells. 9 (8), 1806 (2020).
  13. Eger, N., Schoppe, L., Schuster, S., Laufs, U., Boeckel, J. N. Circular RNA splicing. Advances in Experimental Medicine and Biology. 1087, 41-52 (2018).
  14. Barrett, S. P., Wang, P. L., Salzman, J. Circular RNA biogenesis can proceed through an exon-containing lariat precursor. eLife. 4, 07540 (2015).
  15. Memczak, S., et al. Circular RNAs are a large class of animal RNAs with regulatory potency. Nature. 495 (7441), 333-338 (2013).
  16. Misir, S., Wu, N., Yang, B. B. Specific expression and functions of circular RNAs. Cell Death and Differentiation. 29 (3), 481-491 (2022).
  17. Bai, S., et al. Construct a circRNA/miRNA/mRNA regulatory network to explore potential pathogenesis and therapy options of clear cell renal cell carcinoma. Scientific Reports. 10 (1), 13659 (2020).
  18. Sakshi, S., Jayasuriya, R., Ganesan, K., Xu, B., Ramkumar, K. M. Role of circRNA-miRNA-mRNA interaction network in diabetes and its associated complications. Molecular Therapy - Nucleic Acids. 26, 1291-1302 (2021).
  19. Hansen, T. B., et al. miRNA-dependent gene silencing involving Ago2-mediated cleavage of a circular antisense RNA. The EMBO Journal. 30 (21), 4414-4422 (2011).
  20. Lu, M. Circular RNA: functions, applications, and prospects. ExRNA. 2 (1), 15 (2020).
  21. Liu, K. S., Pan, F., Mao, X. D., Liu, C., Chen, Y. J. Biological functions of circular RNAs and their roles in occurrence of reproduction and gynecological diseases. American Journal of Translational Research. 11 (1), 1-15 (2019).
  22. Pamudurti, N. R., et al. Translation of CircRNAs. Molecular Cell. 66 (1), 9-21 (2017).
  23. Legnini, I., et al. Circ-ZNF609 Is a circular RNA that can be translated and functions in myogenesis. Molecular Cell. 66 (1), 22-37 (2017).
  24. Weigelt, C. M., et al. An insulin-sensitive circular RNA that regulates lifespan in Drosophila. Molecular Cell. 79 (2), 268-279 (2020).
  25. Guo, Y., et al. Identification and characterization of circular RNAs in the A549 cells following Influenza A virus infection. Veterinary Microbiology. 267, 109390 (2022).
  26. Qu, Z., et al. A novel intronic circular RNA antagonizes influenza virus by absorbing a microRNA that degrades CREBBP and accelerating IFN-β production. mBio. 12 (4), 0101721 (2021).
  27. Kawarada, Y., et al. TGF-β induces p53/Smads complex formation in the PAI-1 promoter to activate transcription. Scientific Reports. 6 (1), 35483 (2016).
  28. Yu, T., et al. Circular RNA GATAD2A promotes H1N1 replication through inhibiting autophagy. Veterinary Microbiology. 231, 238-245 (2019).
  29. FastQC: A quality control tool for high throughput sequence data. Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ (2010)
  30. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  31. Zhang, J., Chen, S., Yang, J., Zhao, F. Accurate quantification of circular RNAs identifies extensive circular isoform switching events. Nature Communications. 11 (1), 90 (2020).
  32. Li, H., Durbin, R. Fast and accurate long-read alignment with Burrows-Wheeler transform. Bioinformatics. 26 (5), 589-595 (2010).
  33. Kim, D., Paggi, J. M., Park, C., Bennett, C., Salzberg, S. L. Graph-based genome alignment and genotyping with HISAT2 and HISAT-genotype. Nature Biotechnology. 37 (8), 907-915 (2019).
  34. Pertea, M., et al. StringTie enables improved reconstruction of a transcriptome from RNA-seq reads. Nature Biotechnology. 33 (3), 290-295 (2015).
  35. Li, H., et al. The Sequence Alignment/Map format and SAMtools. Bioinformatics. 25 (16), 2078-2079 (2009).
  36. Wang, L., Wang, S., Li, W. RSeQC: quality control of RNA-seq experiments. Bioinformatics. 28 (16), 2184-2185 (2012).
  37. Dori, M., Caroli, J., Forcato, M. Circr, a computational tool to identify miRNA:circRNA associations. Frontiers in Bioinformatics. 2, 852834 (2022).
  38. Shannon, P., et al. Cytoscape: a software environment for integrated models of biomolecular interaction networks. Genome Research. 13 (11), 2498-2504 (2003).
  39. Wu, T., et al. clusterProfiler 4.0: A universal enrichment tool for interpreting omics data. The Innovation. 2 (3), 100141 (2021).
  40. Yu, G., Wang, L. G., Han, Y., He, Q. Y. clusterProfiler: an R package for comparing biological themes among gene clusters. OMICS: A Journal of Integrative Biology. 16 (5), 284-287 (2012).
  41. . org.Hs.eg.db: Genome wide annotation for human. 2022. R package version 3.15.0 Available from: https://bioconductor.org/packages/release/data/annotation/html/org.Hs.eg.db.html (2022)
  42. Barrett, T., et al. NCBI GEO: archive for functional genomics data sets-update. Nucleic Acids Research. 41, 991-995 (2012).
  43. Gao, Y., Zhang, J., Zhao, F. Circular RNA identification based on multiple seed matching. Briefings in Bioinformatics. 19 (5), 803-810 (2018).
  44. Zhang, X. O., et al. Diverse alternative back-splicing and alternative splicing landscape of circular RNAs. Genome Research. 26 (9), 1277-1287 (2016).
  45. Memczak, S., et al. Circular RNAs are a large class of animal RNAs with regulatory potency. Nature. 495 (7441), 333-338 (2013).
  46. Wang, K., et al. MapSplice: Accurate mapping of RNA-seq reads for splice junction discovery. Nucleic Acids Research. 38 (18), 178 (2010).
  47. Song, X., et al. Circular RNA profile in gliomas revealed by identification tool UROBORUS. Nucleic Acids Research. 44 (9), 87 (2016).
  48. Hansen, T. B. Improved circRNA identification by combining prediction algorithms. Frontiers in Cell and Developmental Biology. 6, 20 (2018).
  49. Robinson, M. D., McCarthy, D. J., Smyth, G. K. edgeR: A bioconductor package for differential expression analysis of digital gene expression data. Bioinformatics. 26 (1), 139-140 (2010).
  50. Ma, X. K., et al. CIRCexplorer3: A CLEAR pipeline for direct comparison of circular and linear RNA expression. Genomics Proteomics Bioinformatics. 17 (5), 511-521 (2019).
  51. Gaffo, E., Buratin, A., Dal Molin, A., Bortoluzzi, S. Sensitive, reliable and robust circRNA detection from RNA-seq with CirComPara2. Briefings in Bioinformatics. 23 (1), (2022).
  52. Glažar, P., Papavasileiou, P., Rajewsky, N. circBase: a database for circular RNAs. RNA. 20 (11), 1666-1670 (2014).
  53. Tan, S., et al. Circular RNA F-circEA-2a derived from EML4-ALK fusion gene promotes cell migration and invasion in non-small cell lung cancer. Molecular Cancer. 17 (1), 138 (2018).
  54. Guarnerio, J., et al. Oncogenic role of Fusion-circRNAs Derived from cancer-associated chromosomal translocations. Cell. 165 (2), 289-302 (2016).
  55. McGeary, S. E., et al. The biochemical basis of microRNA targeting efficacy. Science. 366 (6472), (2019).
  56. Enright, A. J., et al. MicroRNA targets in Drosophila. Genome Biology. 5 (1), 1 (2003).
  57. Rehmsmeier, M., Steffen, P., Hochsmann, M., Giegerich, R. Fast and effective prediction of microRNA/target duplexes. RNA. 10 (10), 1507-1517 (2004).
  58. Zhang, D., et al. AllEnricher: a comprehensive gene set function enrichment tool for both model and non-model species. BMC Bioinformatics. 21 (1), 106 (2020).
  59. Zhou, Y., et al. Metascape provides a biologist-oriented resource for the analysis of systems-level datasets. Nature Communications. 10 (1), 1523 (2019).

Reimpressões e Permissões

Solicitar permissão para reutilizar o texto ou figuras deste artigo JoVE

Solicitar Permissão

Explore Mais Artigos

Retra oEdi o 188RNA circularcircRNAintera o hospedeiro pat geno

This article has been published

Video Coming Soon

JoVE Logo

Privacidade

Termos de uso

Políticas

Pesquisa

Educação

SOBRE A JoVE

Copyright © 2025 MyJoVE Corporation. Todos os direitos reservados