Tutorial de Análise Computacional para RNA Não-Codificante Pequeno Quimérico: Bibliotecas de Sequenciamento de RNA Alvo

Sreenivas Eadara; Xinbei Li; Emily A. Eiss; Mollie K. Meffert

doi:10.3791/65779

É necessária uma assinatura da JoVE para visualizar este conteúdo. Faça login ou comece sua avaliação gratuita.

Method Article

Tutorial de Análise Computacional para RNA Não-Codificante Pequeno Quimérico: Bibliotecas de Sequenciamento de RNA Alvo

DOI:

10.3791/65779

⸱

December 1st, 2023

Sreenivas Eadara¹, Xinbei Li¹, Emily A. Eiss¹, Mollie K. Meffert¹^,²

¹Department of Biological Chemistry, Johns Hopkins University School of Medicine, ²Solomon H. Snyder Department of Neuroscience, Johns Hopkins University School of Medicine

Please note that all translations are automatically generated. Click here for the English version.

Resumo

Aqui, apresentamos um protocolo demonstrando a instalação e o uso de um pipeline de bioinformática para analisar dados de sequenciamento de RNA quimérico usados no estudo de interações RNA:RNA in vivo .

Resumo

A compreensão das interações regulatórias gênicas in vivo de pequenos RNAs não codificadores (sncRNAs), tais como microRNAs (miRNAs), com seus RNAs-alvo, tem sido avançada nos últimos anos por abordagens bioquímicas que usam ligações cruzadas seguidas de ligadura para capturar interações sncRNA:RNA-alvo através da formação de RNAs quiméricos e bibliotecas de sequenciamento subsequentes. Embora os conjuntos de dados do sequenciamento de RNA quimérico forneçam entrada genômica ampla e substancialmente menos ambígua do que o software de previsão de miRNA, destilar esses dados em informações significativas e acionáveis requer análises adicionais e pode dissuadir os investigadores que não têm conhecimento computacional. Este relatório fornece um tutorial para apoiar biólogos computacionais de nível básico na instalação e aplicação de uma ferramenta de software de código aberto recente: Small Chimeric RNA Analysis Pipeline (SCRAP). Requisitos da plataforma, atualizações e uma explicação das etapas do pipeline e manipulação das principais variáveis de entrada do usuário são fornecidas. Reduzir uma barreira para os biólogos obterem insights de abordagens de sequenciamento de RNA quimérico tem o potencial de impulsionar investigações baseadas em descobertas de interações regulatórias de RNA-alvo em múltiplos contextos biológicos.

Introdução

Pequenos RNAs não-codificantes são altamente estudados por seu papel pós-transcricional na coordenação da expressão de conjuntos de genes em diversos processos, como diferenciação e desenvolvimento, processamento de sinais e^{doenças1,2,3}. A capacidade de determinar com precisão os transcritos alvo de pequenos RNAs não codificadores (sncRNAs) reguladores de genes, incluindo microRNAs (miRNAs), é de importância para estudos de biologia de RNA em níveis básicos e translacionais. Algoritmos de bioinformática que exploram a complementaridade antecipada entre a sequência de sementes de miRNA e seus alvos potenciais têm sido frequentemente usados para a predição de interações miRNA:RNA-alvo. Embora esses algoritmos de bioinformática tenham sido bem-sucedidos, eles também podem abrigar resultados falsos positivos e falsos negativos, como já foi revisado em outros^estudos4,5,6. Recentemente, várias abordagens bioquímicas têm sido projetadas e implementadas que permitem a determinação inequívoca e semiquantitativa de interações in vivo sncRNA:RNA-alvo por meio de reticulação in vivo e subsequente incorporação de uma etapa de ligadura para fixar fisicamente o sncRNA ao seu alvo para formar um único RNA quimérico 4,5,7,8,9,10 . A preparação subsequente de bibliotecas de sequenciamento a partir dos RNAs quiméricos permite a avaliação das interações sncRNA:RNA-alvo por processamento computacional dos dados de sequenciamento. Este vídeo fornece um tutorial para instalar e usar um pipeline computacional denominado pipeline de análise de RNA quimérico pequeno (SCRAP), que é projetado para permitir a análise robusta e reprodutível de interações sncRNA:RNA alvo a partir de bibliotecas de sequenciamento de RNA quimérico⁶.

Um objetivo deste tutorial é ajudar os investigadores a evitar a dependência excessiva de algoritmos de bioinformática puramente preditivos, reduzindo as barreiras para a análise de dados gerados através de abordagens bioquímicas fornecendo leituras moleculares quiméricas de interações sncRNA:RNA-alvo. Este tutorial fornece passos práticos e dicas para orientar cientistas computacionais de nível básico através do uso de um pipeline, o SCRAP, desenvolvido para analisar dados de sequenciamento de RNA quimérico, que podem ser gerados por vários protocolos bioquímicos existentes, incluindo reticulação, ligadura e sequenciamento de híbridos (CLASH) e ligadura covalente de RNAs endógenos ligados a Argonauta- crosslinking e imunoprecipitação (CLEAR-CLIP)^7,9.

O uso do SCRAP oferece diversas vantagens para a análise de dados de sequenciamento de RNA quimérico, comparado a outros pipelines^{computacionais6}. Uma vantagem importante é sua extensa anotação e a incorporação de chamadas a scripts de bioinformática bem suportados e atualizados rotineiramente dentro do pipeline, em comparação com pipelines alternativos que geralmente dependem de scripts personalizados e/ou não suportados para etapas no pipeline. Esse recurso confere estabilidade ao SCRAP, tornando mais valioso para os pesquisadores se familiarizarem com o pipeline e incorporarem seu uso em seu fluxo de trabalho. O SCRAP também demonstrou superar pipelines alternativos na chamada de picos de interações sncRNA:target RNA e ter funcionalidade de plataforma cruzada, conforme detalhado em uma publicação anterior⁶.

Ao final deste tutorial, os usuários serão capazes de (i) conhecer os requisitos da plataforma para SCRAP e instalar pipelines SCRAP, (ii) instalar genomas de referência e configurar parâmetros de linha de comando para SCRAP, e (iii) entender os critérios de chamada de pico e executar chamadas de pico e anotação de pico.

Este vídeo descreverá em detalhes práticos como os pesquisadores que estudam a biologia do RNA podem instalar e usar de forma otimizada o pipeline computacional, SCRAP, para analisar as interações do sncRNA com RNAs alvo, tais como RNAs mensageiros, em dados de sequenciamento de RNA quiméricos obtidos através de uma das abordagens bioquímicas discutidas para a preparação da biblioteca de sequenciamento.

SCRAP é um utilitário de linha de comando. Geralmente, seguindo o guia abaixo, o usuário precisará (i) baixar e instalar o SCRAP (https://github.com/Meffert-Lab/SCRAP), (ii) instalar genomas de referência e executar o SCRAP, e (iii) realizar chamadas e anotações de pico.

Mais detalhes das etapas computacionais deste procedimento podem ser encontrados em https://github.com/Meffert-Lab/SCRAP. Este artigo fornecerá a configuração e as informações básicas para permitir que investigadores com habilidades computacionais de nível básico instalem, otimizem e usem o SCRAP em conjuntos de dados de bibliotecas de sequenciamento de RNA quimérico.

Access restricted. Please log in or start a trial to view this content.

Protocolo

NOTA: O protocolo começará com o download e a instalação do software necessário para analisar bibliotecas de sequenciamento de RNA quimérico usando SCRAP.

1. Instalação

Antes de instalar o SCRAP, instale as dependências Git e Miniconda na máquina a ser utilizada para as análises. O Git provavelmente já está instalado. Na plataforma Mac OSX, por exemplo, verifique isso usando qual git para ver se o utilitário " git " está presente e instalado neste diretório. Verifique se o Miniconda está instalado usando qual conda. Se nada for devolvido, instale o Miniconda. O Miniconda requer 400 MB de espaço em disco para ser instalado.
1. Existem alguns métodos para instalar o Miniconda, e eles diferem por plataforma. Consulte o arquivo de markdown PLATFORM-SETUP no repositório GitHub do Meffert Lab [https://github.com/Meffert-Lab/SCRAP/blob/main/PLATFORM-SETUP.md], onde há mais instruções para instalação no Windows, MacOS e Ubuntu. Para usuários Linux, o Linux tem seu próprio gerenciador de pacotes padrão (apt). No caso específico deste estudo, use o comando brew install Miniconda para instalar o Miniconda usando um gerenciador de pacotes existente, brew.
  NOTA: 'Homebrew', denominado 'brew' é um sistema de gerenciamento de pacotes de software de código aberto que simplifica a instalação de software no sistema operacional da Apple, o macOS.
2. Se o conda estiver sendo instalado pela primeira vez, execute o conda init para o shell específico que está em uso. No exemplo aqui, esse shell em uso é zsh. Em seguida, feche e reabra o shell. Se o conda foi instalado com sucesso, o ambiente base ativado dentro da sessão de terminal será visto.
Baixe o código-fonte SCRAP e instale suas dependências.
1. O método preferido para obter a fonte SCRAP é usando o Git. Acesse isso executando o https://github.com/Meffert-Lab/SCRAP de clone do git para obter a cópia mais recente do código-fonte.
2. Instale o mamba, um solucionador de pacotes aprimorado para conda, e instale todas as dependências para SCRAP do SCRAP_environment.yml para seu próprio ambiente conda usando os seguintes comandos:
  conda instalar -n base conda-forge::mamba
  mamba env create -f SCRAP/SCRAP_environment.yml -n SCRAP
Em seguida, execute a instalação de referência para SCRAP. Os argumentos utilizados na instalação de referência serão específicos para o organismo cujas interações sncRNA-mRNA estão sendo analisadas.
bash SCRAP/bin/Reference_Installation.sh -r full/path/to/SCRAP/ -m tem -g hg38 -s humano
1. Forneça o diretório da pasta de origem SCRAP para instalação de referência. As etapas de instalação serão executadas usando os arquivos dentro das pastas fasta e anotação . Liste o caminho completo sem qualquer taquigrafia. Termine com uma barra.
2. Consulte as tabelas em README.md para obter as abreviaturas corretas das espécies miRbase. Os genomas de referência atualizados podem ser encontrados em https://genome.ucsc.edu/ ou https://www.ncbi.nlm.nih.gov/data-hub/genome/. Neste exemplo, hg38 será usado para o genoma GRCm38 do camundongo.
3. As espécies atualmente incluídas para anotação são humanos, camundongos e vermes. Exiba os arquivos species.annotation.bed correspondentes no diretório de anotação na pasta de origem SCRAP. Se o uso de uma espécie diferente para análise for desejado, forneça um arquivo annotation.bed que siga o mesmo esquema de nomenclatura species.annotation.bed.

2. Execução de SUCATA

Agora que as dependências e o SCRAP estão instalados, - execute o script SCRAP.sh
bash SCRAP/bin/SCRAP.sh -d full/path/to/CLASH_Human/ -a full/path/to/CLASH_Human/CLASH_Human_Adapters.txt -p no -f yes -r full/path/to/SCRAP/ -m has -g hg38
1. Liste todo o caminho para os diretórios de exemplo sem qualquer atalho. Formate os diretórios de exemplo com o nome da pasta correspondente exatamente ao nome do exemplo, como mostra a Figura 1.
2. Observe que o caminho listado é o caminho para o diretório que contém todas as pastas de exemplo, não o caminho para qualquer pasta de exemplo individual ou um arquivo de exemplo (consulte a linha de comando na etapa 2.1).
3. Em seguida, liste o caminho inteiro para o arquivo do adaptador. Verifique se os nomes de exemplo no arquivo do adaptador correspondem aos nomes de pasta e nomes de arquivo mencionados anteriormente (consulte a linha de comando na etapa 2.1).
4. Indicar se as amostras são pareadas e se será ou não realizada filtragem para pré-miRNAs e/ou tRNAs. Adicione um filtro para limpeza de rRNA, se desejado (consulte a linha de comando na etapa 2.1).
  Observação : os usuários podem ou não decidir usar esses filtros dependendo dos tipos de amostra e objetivos experimentais. Dependendo do desenho experimental, pré-miRNAs, tRNAs e rRNAs podem consumir a profundidade de sequenciamento disponível para quimeras reais de sncRNA:RNA alvo e os usuários podem empregar filtros para excluí-las. No entanto, os usuários podem querer evitar essa filtragem em determinadas circunstâncias (por exemplo, mapeando alvos de sncRNA para o genoma mitocondrial, que contém rRNAs mitocondriais).
5. Em seguida, liste todo o caminho para o diretório de referência, a abreviação miRbase e a abreviação do genoma de referência (consulte a linha de comando na etapa 2.1).
  Observação : o script pode levar algumas horas para concluir, dependendo do tamanho do conjunto de dados e da CPU do computador que está sendo usado.

3. Pico de chamada e anotação

Quando o SCRAP terminar de ser executado, verifique se a saída inclui, entre outros arquivos, um arquivo SAMPLE.aligned.unique.bam. Este é um arquivo binário contendo alinhamentos de RNAs alvo no genoma de referência fornecido pelo usuário.
Agora execute chamadas de pico executando Peak_Calling.sh.
bash SCRAP/bin/Peak_Calling.sh -d CLASH_Human/ -a CLASH_Human/CLASH_Human_Adapters.txt -c 3 -l 2 -f no -r SCRAP/ -m tem -g hg38
NOTA: A chamada de pico é um recurso do SCRAP, que é projetado para permitir que os pesquisadores avaliem prontamente as interações de RNA:RNA alvo não codificantes mais robustas e reprodutíveis dentro de suas bibliotecas de RNA quimérico. Esse recurso, por exemplo, pode ajudar os pesquisadores a identificar interações que eles podem querer selecionar para uma investigação mais aprofundada. A etapa 3.2.2 abaixo descreve como o usuário define os critérios que deseja usar para definir o rigor com o qual um pico é chamado - isso inclui o número de interações exclusivas, ou leituras de sequenciamento, que devem ter ocorrido para que o pico seja chamado, bem como o número de bibliotecas nas quais essa interação específica deve ter ocorrido.
1. Novamente, liste os caminhos completos para o diretório que contém as pastas de exemplo e o arquivo do adaptador (consulte a linha de comando na etapa 3.2).
2. Em seguida, defina o número mínimo de leituras de sequenciamento necessárias para que um pico seja chamado (consulte a linha de comando na etapa 3.2).
3. Defina o número mínimo de bibliotecas de sequenciamento distintas que devem conter um pico para que ele seja chamado (consulte a linha de comando na etapa 3.2).
  NOTA: A escolha dos valores para os pontos 3.2.2 e 3.2.3 dependerá da natureza das amostras sequenciadas e do número de amostras ou tipos de amostras. Aqui, pelo menos 3 leituras de sequenciamento quimérico em uma amostra são necessárias para chamar um pico, e o pico deve ser suportado por pelo menos 2 amostras. Um investigador avaliando um conjunto de dados no qual há muitas réplicas de bibliotecas de sequenciamento para uma determinada condição, por exemplo, pode decidir exigir a presença das leituras em um número maior de bibliotecas de sequenciamento de amostras.
4. Indique se os sncRNAs da mesma família devem contribuir para o mesmo pico. Por exemplo, como os miRNAs da mesma família compartilham sequências de sementes, esses miRNAs podem se ligar a conjuntos compartilhados e sobrepostos de alvos gênicos; Um usuário pode querer identificar o impacto total de uma família nesses alvos avaliando seus picos coletivos (consulte a linha de comando na etapa 3.2).
5. Em seguida, indique o caminho completo para o diretório de referência, a abreviação miRBase e a abreviação do genoma de referência (consulte a linha de comando na etapa 3.2).
Quando a chamada de pico estiver concluída, execute a anotação de pico.
bash SCRAP/bin/Peak_Annotation.sh -p CLASH_Human/peaks.bed -r SCRAP/ -s humano
1. Liste o caminho completo para o arquivo peaks.bed (ou peaks.family.bed) resultante da chamada de pico, o caminho completo para o diretório de referência e as espécies desejadas para anotação.

4. Visualizando os dados

NOTA: Todas as etapas para análise usando SCRAP agora estão concluídas. Para visualizar os dados, várias abordagens são recomendadas:

Mescle todos os arquivos .bam (arquivo SAM binário) que serão desejados para visualizar juntos (samtools merge).
Classifique o arquivo .bam mesclado resultante (samtools sort). O conteúdo do arquivo é classificado linha por linha para que samtools possa indexar.
Indexe o arquivo .bam classificado (índice samtools). Um arquivo BAI (binary samtools format index) é gerado para permitir a visualização no visualizador de genômica integrativa (IGV).
Finalmente, abra o arquivo .bam classificado e .bai indexado resultante no IGV.
NOTA: SncRNA:As interações de RNA-alvo de interesse podem ser priorizadas para acompanhamento de várias maneiras específicas da investigação. Uma abordagem inicial genérica é avaliar as interações para as quais os picos são suportados pelas leituras de sequenciamento mais quiméricas. Interações de interesse também podem ser visualizadas usando o DuplexFold Web Server do pacote RNAstructure, inserindo a sequência para o sncRNA e o RNA alvo a partir da interação detectada¹¹. Para cada pico, as coordenadas cromossômicas (primeira coluna) e genômicas (início: 1ª coluna: 2ª coluna) podem ser encontradas dentro do arquivo peaks.bed.species.annotation.txt gerado na anotação de pico. Para miRNAs em particular, enquanto interações reprodutíveis e funcionais podem carecer de extensa ligação pareada por sementes (por exemplo, interações podem usar ligação compensatória de 3'), a presença de sítios pareados por sementes em um motivo de ligação cognato do RNA alvo pode, no entanto, ser avaliada como uma característica validadora de interações detectadas funcionalmente importantes ^4,12. O processamento de dados auxiliares poderia incluir comparações de cobertura de leitura diferencial entre picos em condições biológicas distintas e potencialmente avaliação do agrupamento de genes regulados em vias usando uma ferramenta de análise de vias.

Access restricted. Please log in or start a trial to view this content.

Resultados

Os resultados para sncRNA:RNA alvo detectado por uma versão modificada do SCRAP (SCRAP release 2.0, que implementa modificações para filtragem de rRNA) em conjuntos de dados de sequenciamento publicados anteriormente preparados usando CLEAR-CLIP⁹ são mostrados na Figura 2 e na Tabela 1. Os usuários podem apreciar a diminuição nas interações de miRNA de fração relativa com regiões de íntrons que ocorre após o isolamento de interações de...

Access restricted. Please log in or start a trial to view this content.

Discussão

Este protocolo sobre o uso de pipeline SCRAP para análise de interações sncRNA:RNA alvo é projetado para auxiliar os investigadores que estão entrando em análise computacional. Espera-se que a conclusão do tutorial oriente os investigadores com experiência computacional de nível básico ou superior através das etapas necessárias para a instalação e uso deste pipeline e sua aplicação para analisar dados obtidos de bibliotecas de sequenciamento de RNA quimérico. As etapas críticas para a conclusão deste p...

Access restricted. Please log in or start a trial to view this content.

Divulgações

Os autores não têm nada a revelar.

Agradecimentos

Agradecemos aos membros do laboratório Meffert pelas discussões úteis, incluindo BH Powell e WT Mills IV, pelo feedback crítico sobre a descrição da instalação e implementação do gasoduto. Este trabalho foi apoiado por um prêmio da Fundação Braude, o Maryland Stem Cell Research Fund Launch Program, o prêmio Blaustein Endowment for Pain Research and Education e o NINDS RO1NS103974 e NIMH RO1MH129292 para M.K.M.

Access restricted. Please log in or start a trial to view this content.

Materiais

Name	Company	Catalog Number	Comments
Genomes	UCSC Genome browser	N/A	https://genome.ucsc.edu/ or https://www.ncbi.nlm.nih.gov/data-hub/genome/
Linux	Linux	Ubuntu 20.04 or 22.04 LTS recommended
Mac	Apple	Mac OSX (>11)
Platform setup	GitHub	N/A	https://github.com/Meffert-Lab/SCRAP/blob/main/PLATFORM-SETUP.md]
SCRAP pipeline	GitHub	N/A	https://github.com/Meffert-Lab/SCRAP
Unix shell	Unix operating system	bash >=5.0
Unix shell	Unix operating system	zsh (5.9 recommended)
Windows	Windows	WSL Ubuntu 20.04 or 22.04 LTS

Referências

Morris, K. V., Mattick, J. S. The rise of regulatory RNA. Nature Reviews Genetics. 15 (6), 423-437 (2014).
Li, X., Jin, D. S., Eadara, S., Caterina, M. J., Meffert, M. K. Regulation by noncoding RNAs of local translation, injury responses, and pain in the peripheral nervous system. Neurobiology of Pain (Cambridge, Mass.). 13, 100119(2023).
Shi, J., Zhou, T., Chen, Q. Exploring the expanding universe of small RNAs. Nature Cell Biology. 24 (4), 415-423 (2022).
Broughton, J. P., Lovci, M. T., Huang, J. L., Yeo, G. W., Pasquinelli, A. E. Pairing beyond the seed supports microRNA targeting specificity. Molecular Cell. 64 (2), 320-333 (2016).
Grosswendt, S., et al. Unambiguous identification of miRNA:target site interactions by different types of ligation reactions. Molecular Cell. 54 (6), 1042-1054 (2014).
Mills, W. T., Eadara, S., Jaffe, A. E., Meffert, M. K. SCRAP: a bioinformatic pipeline for the analysis of small chimeric RNA-seq data. RNA. 29 (1), 1-17 (2023).
Helwak, A., Kudla, G., Dudnakova, T., Tollervey, D. Mapping the human miRNA interactome by CLASH reveals frequent noncanonical binding. Cell. 153 (3), 654-665 (2013).
Hoefert, J. E., Bjerke, G. A., Wang, D., Yi, R. The microRNA-200 family coordinately regulates cell adhesion and proliferation in hair morphogenesis. Journal of Cell Biology. 217 (6), 2185-2204 (2018).
Moore, M. J., Zhang, C., Gantman, E. C., Mele, A., Darnell, J. C., Darnell, R. B. Mapping Argonaute and conventional RNA-binding protein interactions with RNA at single-nucleotide resolution using HITS-CLIP and CIMS analysis. Nature Protocols. 9 (2), 263-293 (2014).
Bjerke, G. A., Yi, R. Integrated analysis of directly captured microRNA targets reveals the impact of microRNAs on mammalian transcriptome. RNA. 26 (3), 306-323 (2020).
Reuter, J. S., Mathews, D. H. RNAstructure: software for RNA secondary structure prediction and analysis. BMC Bioinformatics. 11 (1), 129(2010).
Moore, M. J., et al. miRNA-target chimeras reveal miRNA 3′-end pairing as a major determinant of Argonaute target specificity. Nature Communications. 6 (1), 8864(2015).
Travis, A. J., Moody, J., Helwak, A., Tollervey, D., Kudla, G. Hyb: a bioinformatics pipeline for the analysis of CLASH (crosslinking, ligation and sequencing of hybrids) data. Methods (San Diego, Calif.). 65 (3), 263-273 (2014).

Access restricted. Please log in or start a trial to view this content.

Reimpressões e Permissões

Solicitar permissão para reutilizar o texto ou figuras deste artigo JoVE

Solicitar Permissão

Explore Mais Artigos

Este m s no JoVE edi o 202

This article has been published

Video Coming Soon

Keep me updated: