JoVE Logo

Entrar

É necessária uma assinatura da JoVE para visualizar este conteúdo. Faça login ou comece sua avaliação gratuita.

Neste Artigo

  • Resumo
  • Resumo
  • Introdução
  • Protocolo
  • Resultados
  • Discussão
  • Divulgações
  • Agradecimentos
  • Materiais
  • Referências
  • Reimpressões e Permissões

Resumo

A análise de rede foi aplicada para avaliar a associação de diversas comunidades microbianas ecológicas, como solo, água e rizosfera. Apresentado aqui é um protocolo sobre como usar o algoritmo WGCNA para analisar diferentes redes de co-ocorrência que podem ocorrer nas comunidades microbianas devido a diferentes ambientes ecológicos.

Resumo

O microbioma raiz desempenha um papel importante no crescimento das plantas e na adaptação ambiental. A análise de rede é uma importante ferramenta para estudar comunidades, que pode explorar efetivamente a relação de interação ou modelo de co-ocorrência de diferentes espécies microbianas em diferentes ambientes. O objetivo deste manuscrito é fornecer detalhes sobre como usar o algoritmo de rede de correlação ponderada para analisar diferentes redes de co-ocorrência que podem ocorrer em comunidades microbianas devido a diferentes ambientes ecológicos. Toda a análise do experimento é realizada no pacote WGCNA. WGCNA é um pacote R para análise ponderada da rede de correlação. Os dados experimentais utilizados para demonstrar esses métodos foram dados da comunidade microbiana do banco de dados do NCBI (National Center for Biotechnology Information) para três nichos do sistema radicular de arroz (Oryza sativa). Utilizamos o algoritmo de rede de correlação ponderada para construir redes de co-abundância da comunidade microbiana em cada um dos três nichos. Em seguida, foram identificadas redes diferenciais de co-abundância entre o solo endosfera, rizoplane e rizosfera. Além disso, os gêneros principais na rede foram obtidos pelo pacote "WGCNA", que desempenha um papel regulado importante nas funções de rede. Esses métodos permitem aos pesquisadores analisar a resposta da rede microbiana à perturbação ambiental e verificar diferentes teorias de resposta ecológica microbiana. Os resultados desses métodos mostram que as significativas redes microbianas diferenciais identificadas na endosfera, rizoplane e rizosfera do solo de arroz.

Introdução

A pesquisa de microbioma tem implicações importantes para compreender e manipular processos ecossistêmicos1,2. As populações microbianas estão interligadas pela interação de redes ecológicas, cujas características podem afetar a resposta dos microrganismos às mudanças ambientais3,4. Além disso, as propriedades dessas redes afetam a estabilidade das comunidades microbianas e estão intimamente associadas à função do solo5. A análise ponderada da rede de correlação genética tem sido amplamente aplicada para pesquisas sobre a relação entre genes e comunidades microbianas6. Estudos anteriores têm focado principalmente nas associações entre redes de diferentes genes ou populações e o mundo exterior7. No entanto, as diferenças nas redes de correlação formadas por populações microbianas em diferentes condições ambientais têm sido pouco investigadas. O objetivo da pesquisa apresentada neste artigo é fornecer insights e detalhes sobre a rápida implementação do algoritmo WGCNA para a construção de uma rede de co-ocorrência de amostras de microbioma coletadas em diferentes condições ambientais. Com base nos resultados da análise, avaliamos a composição e as diferenças da população e discutimos ainda a relação entre diferentes populações microbianas. Foi aplicado o seguinte fluxo básico do algoritmo de rede de correlaçãoponderada 8. Em primeiro lugar, uma matriz de similaridade precisava ser construída através do cálculo do coeficiente de correlação de Pearson entre os perfis de expressão das Unidades Taxonômicas Operacionais (OTU). Em seguida, os parâmetros das funções de adjacência (o poder ou as funções de adjacência sigmoide) foram adotados com um critério de topologia livre de escala, a matriz de similaridade foi transformada em uma matriz de adjacência, e cada rede de co-ocorrência correspondeu a uma matriz de adjacência. Usamos clusters hierárquicos de linkage médio, juntamente com a diferença baseada em TOM para agrupar OTUs com perfis de expressão coerentes em módulos. Além disso, calculamos a relação entre estatísticas conservadoras e os módulos de análise de parâmetros relacionados, identificando finalmente o hub OTU no módulo. Esses métodos são particularmente adequados para a análise das diferenças nas estruturas de rede entre várias populações microbianas em condições ambientais divergentes. Neste manuscrito, descrevemos detalhadamente o método de desenvolvimento da rede de co-expressão, a análise das diferenças entre os módulos e fornecemos uma breve visão geral das etapas do procedimento aplicado para obter as espécies centrais em diferentes redes de módulos.

Protocolo

1. Download de dados

  1. Baixe os dados da adesão PRJNA386367 formam o banco de dados NCBI. A partir dos dados da adesão PRJNA386367, selecione os dados de rizosfera, rizoplano e microbioma da endosfera de plantas de arroz cultivadas por 14 semanas em um campo de arroz submerso em Arbuckle, Califórnia, em 2014.
    NOTA: Os dados de microbioma rizosfera, rizoplane e endosfera foram apresentados pela tabela OTUs na adesão PRJNA386367.

2. Determinação ideal do valor de energia

NOTA: O pacote WGCNA contém todos os seguintes parâmetros funcionais. WGCNA é um pacote R para análise ponderada da rede de correlação. As linhas de comando chave referem-se ao Suplemento S1.

  1. No ambiente de idioma R, abra o software Rstudio e instale o pacote WGCNA.
  2. Carregue os dados e use a função goodSamplesGenes para verificar a correção dos dados. Execute as linhas de comando:
    "gsg = goodSamplesGenes(datExpr0, verbose = 3)
    gsg$allOK "
    Clique em Executar.
  3. Verifique os outliers e armazene amostras que atendam aos requisitos. Quando o resultado da verificação for TRUE, continue para o próximo passo. Guarde o resultado.
  4. Use a função PickSoftThreshold para calcular o índice R2 livre de escala dos dois grupos dos dados em diferentes valores de energia. Execute a linha de comando:
    "sft = pickSoftThreshold(datExpr0, powerVector = poderes, verbose = 5)"
    Clique em Executar.
  5. Visualize os resultados(Figura 1). Execute a linha de comando:
    "plot(sft$fitIndices[,1], sign(sft$fitIndices[,3])*sft$fitIndices[,2],
    xlab="Limiar macio (potência)",ylab="Scale Free Topology Model Fit,signed R^2",type="n",
    principal = pasta ("ES_Scale independência");
    text(sft$fitIndices[,1], sign(sft$fitIndices[,3])*sft$fitIndices[,2],
    rótulos=poderes,cex=cex1,col="vermelho");
    abline (h=0,9,col="vermelho")
    plot (sft$fitIndices[,1], sft$fitIndices[,5],
    xlab="Limiar macio (potência)",ylab="Conectividade média", type="n",
    principal = colar ("conectividade ES_Mean"))
    text(sft$fitIndices[,1], sft$fitIndices[,5], labels=powers, cex=cex1,col="red")"
    Clique em Executar.
    NOTA: A premissa do algoritmo de rede de correlação ponderada é que a estrutura de rede de co-expressão estabelecida está de acordo com os padrões do critério de topologia livre de escala, aumentando sua robustez. Um índice livre de escala perto de 1 indica uma estrutura de rede mais próxima da rede livre de escala.
  6. Selecione o valor de potência quando o índice de escala R2 quadrado superior a 0,9 e proceda para a próxima etapa de análise.
    NOTA: Quando o índice livre de escala está perto de 1, a estrutura da rede está mais próxima da rede livre de escala. Ao analisar duas ou mais redes, é necessário optar por tornar cada rede próxima ao valor de energia da rede livre de escala para satisfazer a comparabilidade entre as redes co-expressas.

3. Construção de uma rede de co-expressão e identificação de módulos

NOTA: Com base no valor de energia calculado acima, a rede de co-ocorrência é construída. As linhas de comando-chave referem-se ao Suplemento S2.

  1. Use a função de adjacência no pacote WGCNA para adicionar parâmetros assinados para a construção de uma rede simbólica de co-ocorrência. Execute a linha de comando:
    "adjacency = adjacency(datExpr0, power = softPower)"
    Clique em Executar.
  2. Aplique a função de similaridade TOM para desenvolver uma rede sobreposta topológica e calcular a rede de diferenças. Execute a linha de comando:
    "TOM = TOMsimilaridade(adjacência);
    dissTOM = 1-TOM"
    Clique em Executar.
    NOTA: O parâmetro assinado foi adicionado para definir o tipo de rede de sobreposição de topologia.
  3. Use a função hclust para selecionar o método de agrupamento hierárquico de ligação média para agrupamento hierárquico. Execute a linha de comando:
    "geneTree = hclust (as.dist(dissTOM), método = "média");"
    Clique em Executar.
  4. Use a função cutreeDynamic para realizar o corte dinâmico do ramo e definir o parâmetro minClusterSize para 30. Obtenha o resultado de reconhecimento do módulo. Execute a linha de comando:
    "DynamicMods = cutreeDynamic(dendro = geneTree, distM = dissTOM, deepSplit = 2, pamRespectsDendro = FALSE, minClusterSize = minModuleSize);"
    Clique em Executar.
    NOTA: O tamanho mínimo do módulo não poderia ser inferior a 30.
  5. Calcule o módulo eigen de cada módulo OTUs pela função moduleEigengenes. Execute a linha de comando:
    "MEList = móduloEigengenes(datExpr0, cores = cores dinâmicas)
    MEs = MEList$eigengenes"
    Clique em Executar.
    NOTA: O módulo eigen representou o nível geral de expressão OTU no módulo. Não era uma OTU específica, mas o primeiro componente principal de cada cluster obtido pela decomposição singular do valor da rede.
  6. Realize a função de cluster com base no coeficiente de correlação do módulo eigen. Use a função mescladaCloseModules para mesclar os módulos com um valor inferior a 0,25. Execute a linha de comando:
    "mesclagem = mesclagemCloseModules(datExpr0, dynamicColors, cutHeight = MEDissThres, verbose = 3)"
    Clique em Executar.
  7. Por fim, use a função plotDendroAndColors para visualização para obter o diagrama de exibição de atribuição do módulo de cada rede de co-expressão(Figura 2). Use a função de tabela para extrair a atribuição do módulo correspondente de cada OTin na tabela de atribuição do módulo. Execute a linha de comando:
    "plotDendroAndColors(geneTree, mescladoColors, "Dinâmica Mesclada", dendroLabels = FALSE,
    hang = 0,03,addGuide = TRUE, guideHang = 0,05,
    principal = "ES_Gene dendrograma e cores do módulo")"
    Clique em Executar.
    NOTA: No diagrama de atribuição do módulo da rede co-expressa, diferentes cores representam módulos diferentes, e o cinza representa OTUs que não podem ser classificados em qualquer módulo. Um maior número de OTUs no módulo cinza indica que a qualidade de pré-processamento em estágio inicial da matriz de expressão é ruim.

4. Comparação de módulos

NOTA: Este método pode ser usado para comparar os módulos de rede de duas comunidades microbianas ecológicas. Neste artigo, compare as diferenças dos módulos de rede microbiana entre endosfera e rizoplano, endosfera e rizosfera, rizosfera e rizoplane.

  1. Teste de preservação
    1. Carregue os parâmetros e os resultados dos dois conjuntos de dados salvos nas etapas anteriores.
    2. Defina o resultado de atribuição do módulo de rede de um grupo de dados microbianos como o grupo de referência, enquanto o outro grupo como o grupo de teste.
    3. Use a função de conservação do módulo para calcular os valores dos parâmetros estatísticos de conservadoridade Z_summary e mediana. Execute a linha de comando:
      "system.time({mp=modulePreservação(multiExpr,
      multiColor,referênciaNetworks=1,
      nPermutação=100, randomSeed=1,quickCor=0,verbose=3)})"
      Clique em Executar.
      NOTA: Este resultado pode quantificar a conservadoridade entre os módulos. Z_summary>10 indica que dois módulos são altamente preservados, enquanto Z_summary<2 denota módulos não preservados. medianRank expressa a preservação relativa do módulo avaliado por classificação. Valores mais medianossamamar módulos não preservados. (As linhas de comando chave referem-se ao Suplemento S3.)
    4. Use a função plot para visualizar os resultados(Figura 3). Obtenha os parâmetros Z_summary e medianRank(Tabela 1).
      NOTA: Os módulos de rede que satisfazem tanto o valor Z_summary inferior a 2 quanto o valor médio do Rank no topo, é o módulo mais altamente não preservado nas duas comunidades microbianas ecológicas.
    5. Com base nos resultados dos dois parâmetros estatísticos acima mencionados para identificar o módulo com o módulo mais altamente não preservado das duas redes.
  2. Análise de correlação da associação do módulo
    1. Os resultados de atribuição do módulo das duas redes foram definidos como referência e o grupo de teste, respectivamente.
      NOTA: As configurações precisam ser as mesmas do teste de preservação.
    2. Use a função corPvalueStudent para extrair o valor kME (associação de módulos) de cada OTU em vários módulos candidatos.
      Execute a linha de comando:
      "Pvalue = as.data.frame(corPvalueStudent(as.matrix
      (ModuleMembership), Samples)"
      Clique em Executar.
      NOTA: kME significa o grau de adesão ao módulo. Me significa módulo eigen, que representa o nível geral de expressão OTU no módulo. kME é o coeficiente de correlação entre cada OTU e o ME. Quantifique a importância da OTU na rede pelo valor kME da OTU. (As linhas de comando chave referem-se ao Suplemento S4.)
    3. Em seguida, utilize a função verboseScatterplot para calcular o coeficiente de correlação do valor kME das OTUs correspondentes nas duas redes e desenhar o diagrama de análise de correlação(Figura 4).
      Execute a linha de comando:
      "verboseScatterplot(abs(TModuleMembership
      [TmoduleGenes, Tcolumn]),
      abs (NModuleMembership[NmoduleGenes, Ncolumn]),
      xlab = pasta ("kME in", "ES"),
      ylab = pasta ("kME in", "RP"),
      principal = pasta ("brilho leve"),
      cex.main = 1,7, cex.lab = 1,6, cex.axis = 1,6, col = modulecolor)"
      Clique em Executar.
    4. Selecione o módulo com o menor coeficiente de correlação do valor kME da OTU das duas redes. Considere este módulo como a maior diferença das duas redes.

5. Análise do módulo de rede diferencial microbiana

  1. Obtenha dados da bactéria dominante através da análise estatística do conjunto de sequência de OTU do módulo com a maior diferença.
    NOTA: O conjunto de sequência OTU do módulo com a maior diferença é resumido pela taxonomia do filo. A bactéria dominante phyla representou mais de 10%.
  2. Em seguida, use a função exportNetworkToCytoscape para obter o arquivo contendo as informações de relacionamento de interação da OTU no maior módulo diferencial.
    Execute a linha de comando:
    "cyt = exportNetworkToCytoscape(modTOM,
    edgeFile = pasta ("NEW-ES_CytoscapeInput-edges-", módulos , ".txt", sep="),
    nodeFile = pasta ("NEW-ES_CytoscapeInput-nodes-", módulos, ".txt", sep="),
    ponderado = TRUE,limiar = 0,5, nodeNames = modProbes,
    altNodeNames = modGenes, nodeAttr = moduleColors[inModule])".
    Clique em Executar.
  3. Importe o arquivo para Cytoscape. Defina o limiar para 0,5 e ajuste outros parâmetros conforme necessário.
  4. Construir uma rede de co-ocorrência de microrganismos diferenciais (Figura 5).
  5. Obteve as informações do gênero principal que tem o papel regulatório mais importante na rede.
    NOTA: De acordo com o valor kME de OUT, o gênero principal pode ser definido.
  6. Finalmente, foram avaliadas as funções do gênero núcleo e sua influência em toda a rede de diferença.

Resultados

Os resultados representativos deste artigo foram baixados a partir dos dados de microbioma raiz de arroz abaker da Califórnia de 2014 no banco de dados NCBI (PRJNA386367)9. Os dados incluem as amostras de microbioma rizosfera, rizoplane e endosfera de plantas de arroz cultivadas por 14 semanas em um campo de arroz submerso. Utilizamos o algoritmo WGCNA para selecionar o valor de potência que satisfez as três redes próximas à rede livre de escala(Figura 1) e desen...

Discussão

As redes de correlação têm sido cada vez mais utilizadas em aplicações bioinformáticas. WGCNA é um método de biologia de sistemas para análise descritiva das relações entre vários elementos de um sistema biológico12. O pacote de software R foi usado em trabalhos anteriores no WGCNA13,14,15. O pacote inclui funções para construção de rede, detecção de módulos, cálculos de propriedades ...

Divulgações

Os autores não têm nada a revelar.

Agradecimentos

O desenvolvimento deste manuscrito foi apoiado por fundos da National Natural Science Foundation of China-Guizhou Provincial People's Government Karst Science Research Center Project (U1812401), Projeto de Pesquisa de Doutorado da Universidade Normal de Guizhou (GZNUD[2011 7]1), Projeto de Apoio à Ciência e Tecnologia da Província de Guizhou (QKHZC[2021]YB459) e ao Projeto de Ciência e Tecnologia do Guiyang([2019]2-8).

Os autores gostariam de agradecer a Edwards J.A et al por fornecer dados de microbioma de arroz em bancos de dados públicos e apoio da TopEdit (www.topeditsci.com) por sua assistência linguística durante a elaboração deste manuscrito.

Materiais

NameCompanyCatalog NumberComments
RThe University of Aucklandversion 4.0.2R is a free software environment for statistical computing and graphics. It compiles and runs on a wide variety of UNIX platforms, Windows and MacOS.
RStdioJJ Allaireversion 1.4.1103The RStudio IDE is a set of integrated tools designed to help you be more productive with R and Python.
Cytoscapeversion 3.7.1Cytoscape is an open source software platform for visualizing complex networks and integrating these with any type of attribute data.
NCBI databaseThe National Center for Biotechnology Information advances science and health by providing access to biomedical and genomic information.

Referências

  1. Philippot, L., Raaijmakers, J. M., Lemanceau, P., vander Putten, W. H. Going back to the roots: the microbial ecology of the rhizosphere. Nature Reviews Microbiology. 11, 789-799 (2013).
  2. Fierer, N. Embracing the unknown: disentangling the complexities of the soil microbiome. Nature Review Microbiology. 15 (10), 579-590 (2017).
  3. Jin, J., Wang, G. H., Liu, X. B., Liu, J. D., Chen, X. L., Herbert, S. J. Temporal and spatial dynamics of bacterial community in the rhizosphere of soybean genotypes grown in a black soil. Pedosphere. 19 (6), 808-816 (2009).
  4. Ma, B., et al. Genetic correlation network prediction of forest soil microbial functional organization. ISME J. 12 (10), 2492-2505 (2018).
  5. de Vries, F. T., et al. Soil bacterial networks are less stable under drought than fungal networks. Nature Communications. 9 (1), 3033 (2018).
  6. Colin, C., et al. Correlating transcriptional networks to breast cancer survival: a large-scale coexpression analysis. Carcinogenesis. (10), 2300-2308 (2013).
  7. Ma, B., Zhao, K., Lv, X., et al. Genetic correlation network prediction of forest soil microbial functional organization. ISME J. 12, 2492-2505 (2018).
  8. Zhang, B., Horvath, S. A general framework for weighted gene co-expression network analysis. Statistical applications in genetics and molecular biology. 4 (1), (2005).
  9. Edwards, J. A., et al. Compositional shifts in root-associated bacterial and archaeal microbiota track the plant life cycle in field-grown rice. PLoS Biology. 16 (2), 2003862 (2018).
  10. Bashan, Y., De-Bashan, L. E. How the Plant Growth-Promoting Bacterium Azospirillum Promotes Plant Growth-A Critical Assessment. Advances in Agronomy. 108, 77-136 (2010).
  11. Lovley, D. R., et al. Geobacter: The Microbe Electric's Physiology, Ecology, and Practical Applications. Advances in Microbial Physiology. 59, 1 (2011).
  12. Langfelder, P., Horvath, S. WGCNA: an R package for weighted correlation network analysis. BMC Bioinformatics. 9, 559 (2008).
  13. Zhang, B., Horvath, S. A General Framework for Weighted Gene Co-expression Network Analysis. Statistical Applications in Genetics and Molecular Biology. 4 (1), 17 (2005).
  14. Horvath, S., Dong, J. Geometric interpretation of Gene Co-expression Network Analysis. PLoS Computational Biology. 4 (8), 1000117 (2008).
  15. Langfelder, P., Horvath, S. Eigengene networks for studying the relationships between co-expression modules. BMC Systems Biology. 1, 54 (2007).
  16. Horvath, S., et al. Analysis of Oncogenic Signaling Networks in Glioblastoma Identifies ASPM as a Novel Molecular Target. Proceedings of the National Academy of Sciences of the United States of America. 103 (46), 17402-17407 (2006).
  17. Carlson, M. R., et al. and Sequence Conservation: Predictions from Modular Yeast Co-expression Networks. BMC Genomics. 7 (1), 40 (2006).
  18. Fuller, T., et al. Weighted Gene Co-expression Network Analysis Strategies Applied to Mouse Weight. Mammalian Genome. 6 (18), 463-472 (2007).
  19. Yin, L., Wang, Y., Lin, Y., et al. Explorative analysis of the gene expression profile during liver regeneration of mouse: a microarray-based study[J]. Artificial Cells Nanomedicine & Biotechnology. 47 (1), 1113-1121 (2019).
  20. Oldham, M., Horvath, S., Geschwind, D. Conservation and Evolution of Gene Co-expression Networks in Human and Chimpanzee Brains. Proceedings of the National Academy of Sciences of the United States of America. 103 (47), 17973-17978 (2006).
  21. Oldham, M. C., et al. Functional organization of the transcriptome in human brain. Nature Neuroscience. 11 (11), 1271-1282 (2008).
  22. Keller, M. P., et al. A gene expression network model of type 2 diabetes links cell cycle regulation in islets with diabetes susceptibility. Genome Research. 18 (5), 706-716 (2008).
  23. Weston, D., Gunter, L., Rogers, A., Wullschleger, S. Connecting genes, coexpression modules, and molecular signatures to environmental stress phenotypes in plants. BMC Systems Biology. 2 (1), 16 (2008).
  24. Jorda´n, F. Keystone species and food webs. Biological Sciences. 364, 1733-1741 (2009).
  25. Backhed, F., Ley, R. E., Sonnenburg, J. L., Peterson, D. A., Gordon, J. I. Host-Bacterial Mutualism in the Human Intestine. Science. 307, 1915-1920 (2009).

Reimpressões e Permissões

Solicitar permissão para reutilizar o texto ou figuras deste artigo JoVE

Solicitar Permissão

Explore Mais Artigos

BiologiaEdi o 175Rede de Co ocorr nciaMicrorganismo RaizNichoPopula es Microbianas Diferenciais

This article has been published

Video Coming Soon

JoVE Logo

Privacidade

Termos de uso

Políticas

Pesquisa

Educação

SOBRE A JoVE

Copyright © 2025 MyJoVE Corporation. Todos os direitos reservados