O DiCoExpress fornece uma análise aorística completa do controle de qualidade à co-expressão. Realiza análise diferencial baseada em contrastes dentro do modelo linear generalizado. Além disso, também pode realizar uma análise de enriquecimento na lista de genes expressos diferencialmente e os aglomerados genéticos co-expressos.
A principal vantagem do DiCoExpress é que ele pode ser usado por pessoas como eu, sem qualquer conhecimento particular em estatística ou programação aérea. Ele realmente ajuda um usuário não especializado a escrever o contraste necessário para a análise diferencial da expressão genética. Também fornece saídas gráficas ilustrando os resultados prontos para publicação.
O DiCoExpress não é uma ferramenta dedicada a planos. Pode ser usado para qualquer organismo, desde que o projeto experimental esteja completo com até dois fatores biológicos. Além disso, o desenho de uma membrana com um número desigual de réplicas entre as condições também é possível.
Um iniciante deve ter conhecimento preliminar em R.Você deve saber como usar uma função e identificar argumentos necessários e opcionais. Em seguida, o passo crítico é fornecer corretamente os arquivos que contêm o e o design experimental. Para começar, abra a sessão do estúdio R.
Defina o diretório para modelar scripts e abra o tutorial dot R do DiCoExpress. Carregue as funções do DiCoExpress na sessão R. Em seguida, carregue arquivos de dados na sessão R e divida os arquivos de dados do objeto em vários objetos para manipular os arquivos facilmente.
Em seguida, selecione uma estratégia entre as condições de NB ou NB replica e um limiar para filtrar genes expressos baixos. Especifique as cores do grupo e selecione um método de normalização. Em seguida, execute o controle de qualidade.
Se os dados forem emparelhados de acordo com o estado do fator de replicação, o estado se replica como verdadeiro, caso contrário, o estado é falso. Atribuir a interação como verdadeira para considerar uma interação entre os dois fatores biológicos. Caso contrário, atribua falso, então especifique o modelo estatístico e defina o limiar da taxa de detecção falsa.
Realizar a análise diferencial seguida de fixação de um limiar para a análise de enriquecimento e realização da análise de enriquecimento de listas genéticas expressas diferencialmente. Selecione as listas DEG a serem comparadas. Forneça um nome para a comparação da lista e use o mesmo nome para o diretório onde os arquivos de saída serão salvos.
Defina a operação do parâmetro para união ou intersecção para especificar a ação a ser feita nas listas DEG e compare as listas. Realizar uma análise de co-expressão seguida pela realização da análise de enriquecimento dos clusters de co-expressão. E, finalmente, gerar dois arquivos de registro contendo todas as informações necessárias para reproduzir a análise.
A contagem total normalizada por amostra deve ser semelhante quando comparadas tanto as condições intra quanto as inter. As contagens de expressão genética normalizada apresentaram mediação e variância semelhantes, tanto em condições intra quanto inter. Para identificar as potenciais estruturas de dados subjacentes, foram geradas parcelas pca.
Observou-se clara distinção entre os tratamentos e o agrupamento, indicando um conjunto de dados de boa qualidade. Os histogramas de pvalue bruto foram traçados para avaliar a qualidade da modelagem. A distribuição de valores brutos foi uniforme, com pico no lado esquerdo da distribuição, como esperado.
A ausência de um pico no lado direito indica que a modelagem estatística parece correta. O perfil de expressão de Gene CIG62301.1, em todos os genótipos e condições, foi traçado. Assim como o número de genes expressos diferencialmente para cima e para baixo, também foram traçados para cada contraste testado.
A análise de co-expressão foi realizada na união de cinco listas de DEG. Identificados em contraste, procurando variação de resposta ao tratamento entre genótipo um ou dois contra outros. Os genes co-expressos para cada cluster identificado foram impressos em arquivos de texto individuais e o perfil de expressão dos genes foi plotado.
Com o DiCoExpress, os biólogos receberão análises de expressão genética que são estatisticamente sólidas. O próximo passo é fazer sentido biológico, a partir desses resultados.