RNAs circulares desempenham importantes papéis regulatórios em diferentes processos biológicos. Este protocolo é adequado para iniciantes realizarem análises de RNA circular na área de interações entre hospedeiro e patógeno. Aqui reunimos algumas das ferramentas para criar um protocolo simplificado necessário para previsão e quantificação seguras de RNA, enriquecimento funcional seguro de RNA, RNA seguro, predição de interação de micro-RNA e construções de rede de RNA CCE.
Este protocolo simplificado pode ser aplicado a amostras clínicas para identificar determinados candidatos, valores diagnósticos e prognósticos em um ambiente de interação hospedeiro e patógeno. Espero que aqueles que não têm conhecimento prévio de programação tenham dificuldade em fazer a fase inicial desta técnica. Portanto, aconselho aprender o básico das linguagens de programação utilizadas nesta técnica.
Acredito que geralmente olhando para como a linguagem de programação é aplicada para ser mais informativo e mais fácil de entender em comparação com a leitura sozinho. Para começar, abra um terminal Linux e no diretório do genoma de referência do host, execute os comandos bwa index e hisat2-build para indexar o genoma. Prepare um arquivo de configuração yml contendo o nome do arquivo, o caminho das ferramentas, o caminho para os arquivos de referência baixados e o caminho para os arquivos de índice.
Especifique o tipo de biblioteca dos dados de sequência de RNA e execute a ferramenta Ciriquant usando os parâmetros padrão ou manuais. Prepare um arquivo de texto com uma lista de dados contendo os IDs dos dados da sequência de RNA, o caminho para os arquivos GTF emitidos pelo Ciriquant e o agrupamento dos dados da sequência de RNA, seja um controle ou um grupo tratado. No terminal Linux, execute prep_Ciriquant com um arquivo de texto preparado como entrada.
Essa execução gerará uma lista de arquivos. Prepare um segundo arquivo de texto com uma lista de dados contendo os IDs de sequência de RNA e o caminho para sua respectiva saída de vínculo de cadeia de caracteres. O layout do arquivo deve ser semelhante ao arquivo de texto preparado anteriormente sem que a coluna de agrupamento seja executada.
Execute a preparação. py com este arquivo de texto como uma entrada para gerar os arquivos de matriz de contagem de genes. Execute Ciri_DE_Replicate com o library_info.
CSV, circRNA_BSJ. CSV e gene_count_matrix. arquivos csv como entrada para a saída do circRNA_DE final.
arquivo tsv. Para filtrar e determinar o número de circRNAs diferencialmente expressos, ou DE, abra o circRNA_DE. tsv com R ou qualquer outro software de planilha.
Descompacte e extraia o conteúdo do arquivo CircR depois de baixá-lo da página GitHub do CircR usando o software relevante, como WinRar ou 7-Zip. Em um novo diretório onde a análise será conduzida. Em seguida, instale os aplicativos de software de pré-requisito, como SAMTools, miRanda, RNAhybrid e Pybedtools antes de realizar a análise de miRNA circRNA.
Indexe o arquivo de genoma de referência do organismo de interesse usando o comando SAMtools FAIDX e prepare um arquivo de entrada que consiste nas coordenadas dos circRNAs DE de interesse em um arquivo de leito delimitado por tabulação. Em seguida, execute Circr. py usando Python3.
E como argumentos especificam o arquivo de entrada circRNA, o genoma mais rápido do organismo de interesse, a versão do genoma do organismo selecionado, o número de threads e o nome do arquivo de saída na linha de comando. Uma vez concluída a análise do Circr, o programa gera um arquivo de interação circRNA-miRNA no formato CSV. Prepare um arquivo delimitado por abas contendo os circRNAs de interesse e seus miRNAs alvo.
A primeira coluna consiste no nome circRNA. A segunda coluna especifica o tipo de RNA da primeira coluna. A terceira coluna é o miRNA alvo.
E a quarta coluna especifica o tipo de RNA da terceira coluna. Para construir o mapa de rede ceRNA, abra o software Cytoscape, navegue até o arquivo, importe, conecte a rede do arquivo, selecione o arquivo preparado e carregue-o. Pressione o botão de estilo para alterar o estilo visual da rede.
Em seguida, pressione a seta no lado direito da cor de preenchimento, escolha o tipo para a coluna, mapeamento discreto para o tipo de mapeamento e selecione a cor desejada para cada tipo de RNA. Depois disso, navegue até a forma para alterar a forma dos nós e siga as etapas mostradas anteriormente. Para ontologia gênica e análise KEGG do gene parental dos circRNAs, assegure-se do cluster profiler e org. Hs.eg.
Os pacotes db foram instalados em nosso estúdio. Importe as informações de circRNA DE para o espaço de trabalho do estúdio R. Se o usuário deseja converter os nomes dos genes parentais para outros formatos, como o entrezid, use uma função como licitante.
Use o ID do gene como uma entrada e execute a ontologia do gene e a análise de enriquecimento usando a função enrichGO dentro do perfil ou pacote do cluster usando parâmetros padrão. Finalmente, execute a análise de enriquecimento KEGG usando o ID do gene como entrada e a função enrichKEGG dentro do pacote do criador de perfis de cluster. O gráfico de bolhas da análise de enriquecimento de ontologias gênicas de genes parentais de DE circRNA é mostrado nesta figura.
A razão gênica no eixo x é o número de genes nessa lista de entrada associada a um determinado termo de ontologia gênica dividido pelo número total de genes nesse termo. O tamanho do ponto no gráfico é representado pelo valor de contagem, que é o número de genes na lista de entrada associados a um determinado termo de ontologia gênica. Quanto maior o tamanho dos pontos, maior o número de genes de entrada associados ao termo.
Os pontos no gráfico são codificados por cores com base no valor de p, que é calculado comparando a frequência observada de um termo de anotação com a frequência esperada ao acaso. O enriquecimento é estatisticamente significativo e plotado no gráfico de bolhas somente se o valor de p for menor que 0,01. Aqui, os três principais enriquecimentos para os processos biológicos incluem a biogênese do complexo ribonucleoproteico, a resposta ao vírus e a regulação da resposta a um estímulo biótico.
Enquanto para as funções moleculares, apenas a atividade catalítica atuando sobre o RNA e a ligação do RNA de fita simples são estatisticamente enriquecidas. Para os componentes celulares, apenas o complexo retromérico é estatisticamente enriquecido. Esta imagem representativa mostra a análise de enriquecimento de KEGG dos genes parentais do circRNA DE em um gráfico de bolhas.
Apenas dois termos KEGG foram enriquecidos neste caso, a influenza A e as vias do ciclo de vida viral. Uma das coisas mais importantes ao tentar esse procedimento é garantir o tipo de traço correto do conjunto de dados de RNA circ que você está usando ao executar um lesão. O pipeline bio-formatico fornecido aqui ajuda na previsão dos RNAs seculares potenciais e das anotações funcionais.
No entanto, uma verificação bem conduzida ainda será necessária para fornecer evidências sólidas. Este protocolo permitirá que os pesquisadores descubram o RNA seguro e seus papéis funcionais potenciais nos diferentes códigos e interações patogénicas, que podem estudar mais.