O CorExplorer encontra fatores de expressão genética associados ao tumor de uma forma matematicamente com princípios usando visualizações interativas, bem como informações clínicas e de banco de dados para descoberta biológica. O CorEx realiza a maximização das informações de uma forma que requer relativamente poucas amostras para encontrar clusters em dados de alta dimensão. A hierarquia dos fatores latentes que produz facilita a compreensão biológica.
Este método já se mostrou interessante quando aplicado à biologia do câncer. Suas fundações teóricos de informação tornam-no aplicável a qualquer sistema com muitas variáveis e pouco conhecimento prévio sobre seus relacionamentos. Comece navegando até a página inicial do CorExplorer.
Em Links Rápidos, clique no botão plus expande para ver um resumo do gráfico de fator CorEx que foi treinado sobre os dados de câncer de interesse. Por exemplo, aqui, os gráficos de fator para dados de câncer de ovário TCGA são mostrados. Depois de inspecionar os gráficos de fator, clique em TCGA-LUAD pulmonar para acessar a página CorExplorer para sequenciamento de RNA de câncer de pulmão e use a janela CorExplorer Factor Graph para explorar o gráfico fator CorEx para um gene de interesse.
Ao mover o cursor do mouse sobre a janela de exibição do gráfico de fatores, amplie o gráfico de fatores usando o trackpad do mouse para visualizar os detalhes do gráfico, como os genes mais importantes em cada fator e as conexões entre os nós em diferentes camadas. Para localizar um gene de destino, clique no menu Gene e digite o nome do gene para selecioná-lo na lista de suspensos. Pressione Retorne no teclado para fazer a visualização dar zoom ao fator com o qual o gene de interesse está mais fortemente correlacionado.
Reposicione o mouse sobre o visor gráfico e role para diminuir o zoom para ver o nível do nó e seus fatores associados que são vizinhos ao fator genético mais associado. Observe que apenas genes com um peso maior do que o limiar indicado no controle deslizante min Link Weight são mostrados. Para visualizar todos os genes associados ao fator, clique no nó apropriado e selecione Carregar genes adicionais na janela pop-up.
Quando Done aparecer, feche a janela pop-up. Na seção cabeçalho, clique e arraste o modificador min Link Weight para 0,05 para permitir que os genes apareçam em ordem de peso. Para identificar associações com uma função biológica, na janela de anotação desmarcar a taxa de descoberta falsa para classificar o menu de queda do fator por número de fator em vez de taxa de descoberta falsa.
Role e clique para selecionar o fator de interesse no menu suspenso da janela Denotação para revelar as anotações de enriquecimento para o fator. Em seguida, clique em um fator de enriquecimento para visualizar imediatamente os genes associados como destacados em amarelo no visor gráfico. Observe que os fatores que desaparecem ou aparecem como diferentes termos go são selecionados de acordo com se eles são ou não enriquecidos para genes com a anotação selecionada.
Para fatores de interesse do filtro, usando a qualidade de sobrevivência e cluster, a partir do menu suspenso do Dataset selecione TCGA_OVCA para ir à página CorExplorer para o sequenciamento de RNA de câncer de ovário TCGA. Observe na janela Survival o fator com o maior diferencial de sobrevivência e selecione este fator na janela Fator Gráfico do menu suspenso factor. Clique e arraste o controle deslizante Link Weight para 0,5 e observe o número de genes no fator.
Expanda a lista de fatores na janela Sobrevivência e clique no próximo melhor fator na queda da janela Survival para ver suas curvas de sobrevivência associadas. As anotações significativas de GO e Kegg serão mostradas. Para obter uma melhor compreensão do papel biológico dos genes nesse fator, selecione a camada Fator na parte superior da janela Factor Graph e mova o mouse sobre a janela enquanto amplia para revelar todo o cluster e fatores associados.
Para entender a significância relativa dos fatores ligados ao nó de cluster desmarcar Tipo por p-val na janela Sobrevivência e clicar em cada um dos números de fator em sucessão para vê-los, observando os fatores que exibem uma associação de sobrevivência. No menu Adicionar janela selecione PPI e clique em Adicionar para adicionar uma janela de gráfico PPI à área de exibição. Na janela de gráficos do PPI selecione uma camada fator de interesse para exibir as interações proteína-proteína que são significativas.
Clique no link Exibir no StringDB para se conectar ao banco de dados on-line do STRINGdb e clique em Continuar. Em seguida, abra a guia Anaylsis para obter uma análise go on-line para os genes da rede PPI. O componente celular superior será exibido.
Retorne à guia CorExplorer e à janela PPI e selecione outro fator. Clique no link Exibir no StringDB novamente. Um componente celular superior diferente será exibido.
Em seguida, na janela PPI, selecione outro fator para uma análise de banco de dados STRING. Para encontrar semelhanças e diferenças de variação de expressão genética entre os tipos de tumor, clique no título CorExplorer para retornar à primeira página e clique em Pesquisar para acessar uma página que permite a pesquisa de todos os conjuntos de dados no site corExplorer. Na caixa Pesquisa de genes digite um nome genético de interesse e clique em Pesquisar.
Por exemplo, como demonstrado FLT1 é encontrado com um peso relativamente alto e vários fatores diferentes. A busca pelo gene BRCA1 no conjunto de dados do câncer de pulmão revela que o gene é o mais fortemente associado ao fator CorEx 26. O enriquecimento do termo GO para este fator é extremamente alto, com o reparo de DNA exibindo uma falsa taxa de descoberta de apenas uma vezes 10 para o 19 negativo.
A seleção também chama a atenção para o cluster de segundo nível L2_8 que tem seis fatores intimamente relacionados quando crianças. A rede de interação proteína-proteína de reparação de DNA está fortemente conectada, apoiando ainda mais a funcionalidade fortemente ligada dos genes no fator 26. Os gráficos de sobrevivência associados sugerem uma possível associação com a sobrevivência do paciente que teria que ser confirmada em um conjunto de dados maior.
A partir da avaliação de sobrevivência pode permitir a dissecção dos fatores que se correlacionam com uma melhor sobrevida associada a determinados grupos de expressão genética. A adição de uma janela de Interação Proteína-Proteína para cada fator, por sua vez, facilita a determinação de possíveis explicações para suas associações com a sobrevivência. É importante verificar os mapas de calor de cada fator para confirmar que o padrão de expressão genética é de qualidade adequada para suportar interpretações biológicas.
Mapas de calor que mostram variações fortes e claras nos padrões de expressão genética podem exibir uma expressão coordenada dos genes fatores, variando de padrões altos a baixos ou mais complexos, com alguns genes tendo baixa expressão correlacionada com outros genes com alta expressão. O objetivo geral deste procedimento é definir uma terapia personalizada mapeando um tumor amostral nos fatores CorExplorer para identificar potenciais terapias específicas do tumor.