É necessária uma assinatura da JoVE para visualizar este conteúdo. Faça login ou comece sua avaliação gratuita.
Method Article
Nosso ponto de mudança Bayesiana (BCP) algoritmo baseia-se no estado-da-arte avanços em modelagem de mudanças de pontos através de modelos ocultos de Markov e os aplica a cromatina imunoprecipitação seqüenciamento (ChIPseq) análise de dados. BCP executa bem em tipos de dados ampla e pontuada, mas supera em identificar com precisão robustos, ilhas reproduzíveis de enriquecimento histona difusa.
ChIPseq é uma técnica amplamente utilizada para investigar interacções DNA-proteína. Ler a densidade perfis são gerados usando a próxima sequência de ADN ligado à proteína e alinhando a curto leituras para um genoma de referência. Regiões enriquecidas são revelados como picos, o que muitas vezes diferem dramaticamente de forma, dependendo da proteína alvo 1. Por exemplo, factores de transcrição ligam frequentemente em um local e modo específico da sequência e tendem a produzir picos puntiformes, enquanto que modificações de histonas são mais difusas e caracterizam-se por grandes difusas, ilhas de enriquecimento 2. Confiável identificação dessas regiões foi o foco do nosso trabalho.
Algoritmos de análise de dados ChIPseq empregaram várias metodologias, de heurísticas 3-5 aos mais rigorosos modelos estatísticos, por exemplo, modelos ocultos de Markov (HMM) 6-8. Nós procuramos uma solução que minimizasse a necessidade de difíceis de definir, parâmetros ad hoc, que muitas vezescomprometer resolução e diminuir a possibilidade de utilização intuitiva da ferramenta. Com relação aos métodos baseados em HMM, buscamos reduzir os procedimentos de estimação e de parâmetros simples, classificações de estado finito que são frequentemente utilizados.
Além disso, a análise de dados convencional ChIPseq envolve categorização do esperado ler perfis de densidade como quer punctata ou difusa seguido de posterior aplicação da ferramenta apropriada. Nós ainda como objetivo substituir a necessidade de estes dois modelos distintos com um único modelo mais versátil, que pode competentemente abordar todo o espectro de tipos de dados.
Para atingir estes objectivos, o primeiro construído um quadro estatístico que naturalmente modelados estruturas ChIPseq de dados usando um avanço de ponta em HMMs 9, que utiliza apenas fórmulas explícitas-uma inovação crucial para suas vantagens de desempenho. Modelos mais sofisticados, em seguida, heurísticas, nossa HMM acomoda infinitos estados ocultos através de umModelo Bayesian. Nós aplicamos a identificação de pontos de mudança razoável na densidade de ler, que ainda definir segmentos de enriquecimento. Nossa análise revelou como nosso Bayesiana mudar o ponto algoritmo (BCP) teve uma complexidade computacional reduzido evidenciado por um tempo de execução abreviada e consumo de memória. O algoritmo BCP foi aplicado com sucesso tanto o pico punctata e identificação ilha difusa com precisão robusto e limitados parâmetros definidos pelo usuário. Isto ilustrado tanto a sua versatilidade e facilidade de uso. Conseqüentemente, acreditamos que pode ser implementada facilmente em intervalos amplos de tipos de dados e usuários finais de uma forma que pode ser facilmente comparados e contrastados, tornando-se uma grande ferramenta para ChIPseq análise de dados que pode ajudar na colaboração e corroboração entre grupos de pesquisa. Aqui, demonstramos a aplicação do factor de transcrição de BCP existente 10,11 e 12 epigenéticas dados para ilustrar a sua utilidade.
1. Preparando os arquivos de entrada para o BCP Análise
2a. Difundir Leia Perfis: Chip pré-processamento Leia Densidades para Detecção de Enriquecido Ilhas em Dados Difusos
2b. Puntiformes Perfis Leia: Chip pré-processamento e arquivos CAMA entrada para detecção de picos de Dados puntiformes
3. Estimar a média posterior Leia densidade de cada bloco usando nosso aproximação BCMIX
4a. Difundir Leia Perfis: pós-processo médias a posteriori em segmentos de Enriquecimento difusa
4b. Punctata Leia Perfis: pós-processo médias a posteriori para candidatos de pico
BCP destaca em identificação de regiões de enriquecimento amplo em dados de modificação de histonas. Como ponto de referência, que anteriormente comparação dos nossos resultados aos de SICER 3, uma ferramenta já existente que tem demonstrado forte desempenho. Para ilustrar melhor as vantagens do BCP, examinamos uma modificação de histonas que tinha sido bem estudado para estabelecer uma base para avaliar as taxas de sucesso. Com isto em mente, é então analisada H3K36me3, uma vez que tem sido demo...
Nós nos propusemos a desenvolver um modelo de análise de dados que possam identificar ChIPseq ambas as estruturas puntiformes e difusos dados igualmente bem. Até agora, as regiões de enriquecimento, as regiões particularmente difusas, que refletem a expectativa pressuposto de tamanho grande ilha, têm sido difíceis de identificar. Para resolver esses problemas, foram utilizados os mais recentes avanços na tecnologia de HMM, que possuem muitas vantagens sobre os modelos heurísticos existentes e HMMs menos inovado...
Não há conflitos de interesse declarados.
STARR prêmio fundação (MQZ), NIH concessão ES017166 (MQZ), NSF concessão DMS0906593 (HX).
Name | Company | Catalog Number | Comments |
Nome do reagente | Companhia | Número de catálogo | Comentários (opcional) |
Baseado em Linux estação de trabalho |
Solicitar permissão para reutilizar o texto ou figuras deste artigo JoVE
Solicitar PermissãoThis article has been published
Video Coming Soon
Copyright © 2025 MyJoVE Corporation. Todos os direitos reservados