JoVE Logo

Войдите в систему

Для просмотра этого контента требуется подписка на Jove Войдите в систему или начните бесплатную пробную версию.

В этой статье

  • Резюме
  • Аннотация
  • Введение
  • протокол
  • Результаты
  • Обсуждение
  • Раскрытие информации
  • Благодарности
  • Материалы
  • Ссылки
  • Перепечатки и разрешения

Резюме

Сетевой анализ был применен для оценки ассоциации различных экологических микробных сообществ, таких как почва, вода и ризосфера. Здесь представлен протокол о том, как использовать алгоритм WGCNA для анализа различных сетей совместного возникновения, которые могут возникать в микробных сообществах из-за различных экологических сред.

Аннотация

Корневой микробиом играет важную роль в росте растений и адаптации к окружающей среде. Сетевой анализ является важным инструментом для изучения сообществ, который может эффективно исследовать взаимосвязь или модель совместного возникновения различных микробных видов в разных средах. Целью этой рукописи является предоставление подробной информации о том, как использовать алгоритм взвешенной корреляционной сети для анализа различных сетей совместного возникновения, которые могут возникать в микробных сообществах из-за различных экологических сред. Весь анализ эксперимента выполняется в пакете WGCNA. WGCNA представляет собой R-пакет для взвешенного корреляционного сетевого анализа. Экспериментальные данные, использованные для демонстрации этих методов, были данными микробного сообщества из базы данных NCBI (Национальный центр биотехнологической информации) для трех ниш корневой системы риса (Oryza sativa). Мы использовали алгоритм взвешенной корреляционной сети для построения сетей совместного изобилия микробного сообщества в каждой из трех ниш. Затем были выявлены дифференциальные сети совместного изобилия между эндосферой, ризопланом и ризосферой почвы. Кроме того, основные роды в сети были получены пакетом «WGCNA», который играет важную регулируемую роль в сетевых функциях. Эти методы позволяют исследователям анализировать реакцию микробной сети на нарушение окружающей среды и проверять различные теории микробного экологического ответа. Результаты этих методов показывают, что значимые дифференциальные микробные сети выявлены в эндосфере, ризоплане и ризосфере почвы риса.

Введение

Исследования микробиома имеют важные последствия для понимания и манипулирования экосистемными процессами1,2. Микробные популяции взаимосвязаны взаимодействующими экологическими сетями, характеристики которых могут влиять на реакцию микроорганизмов на изменения окружающей среды3,4. Кроме того, свойства этих сетей влияют на стабильность микробных сообществ и тесно связаны с функцией почвы5. Взвешенный анализ корреляционной сети генов в настоящее время широко применяется для исследований взаимосвязи между генами и микробными сообществами6. Предыдущие исследования были сосредоточены в основном на ассоциациях между сетями различных генов или популяций и внешним миром7. Однако различия в корреляционных сетях, сформированных микробными популяциями в различных условиях окружающей среды, практически не исследовались. Цель исследования, представленного в этой статье, состоит в том, чтобы предоставить информацию и подробную информацию о быстрой реализации алгоритма WGCNA для построения сети совместного возникновения образцов микробиома, собранных в различных условиях окружающей среды. На основе результатов анализа мы оценили состав и различия популяции и далее обсудили взаимосвязь между различными микробными популяциями. Применен следующий базовый поток взвешенной корреляционной сетиалгоритма 8. Во-первых, необходимо было построить матрицу подобия путем вычисления коэффициента корреляции Пирсона между профилями выражений операционных таксономических единиц (OTU). Затем параметры функций смежности (степенные или сигмовидные функции смежности) были приняты с критерием топологии без шкалы, матрица подобия была преобразована в матрицу смежности, и каждая сеть совместного возникновения соответствовала матрице смежности. Мы использовали среднюю иерархическую кластеризацию связей в сочетании с непохожестью на основе TOM для группировки OTUs с когерентными профилями выражений в модули. Далее мы рассчитали взаимосвязь между консервативной статистикой и соответствующими модулями анализа параметров, окончательно определив хаб OTU в модуле. Эти методы особенно подходят для анализа различий в сетевых структурах между различными микробными популяциями в различных условиях окружающей среды. В этой рукописи мы подробно описали метод развития сети коэкспрессии, анализ несходств между модулями и предоставили краткий обзор этапов процедуры, применяемой для получения основных видов в различных модульных сетях.

протокол

1. Загрузка данных

  1. Скачать данные о присоединении PRJNA386367 из базы данных NCBI. Из данных присоединения PRJNA386367 выберите данные о ризосфере, ризоплане и эндосфере микробиома риса, выращенных в течение 14 недель на затопленном рисовом поле в Арбакле, штат Калифорния, в 2014 году.
    ПРИМЕЧАНИЕ: Данные о микробиоме ризосферы, ризоплана и эндосферы были представлены таблицей OTUs в присоединении PRJNA386367.

2. Определение оптимального значения мощности

ПРИМЕЧАНИЕ: Пакет WGCNA содержит все следующие функциональные параметры. WGCNA представляет собой R-пакет для взвешенного корреляционного сетевого анализа. Ключевые командные строки ссылаются на Дополнение S1.

  1. В языковой среде R откройте программное обеспечение Rstudio и установите пакет WGCNA.
  2. Загрузите данные и используйте функцию goodSamplesGenes для проверки правильности данных. Выполните командные строки:
    "gsg = goodSamplesGenes(datExpr0, verbose = 3)
    gsg$allOK "
    Нажмите кнопку Выполнить.
  3. Проверьте наличие выбросов и сохраните образцы, соответствующие требованиям. Когда результат проверки будет верен, перейдите к следующему шагу. Сохраните результат.
  4. Используйте функцию PickSoftThreshold для вычисления бесмасштабного индекса R2 двух групп данных при разных значениях мощности. Выполните командную строку:
    "sft = pickSoftThreshold(datExpr0, powerVector = powers, verbose = 5)"
    Нажмите кнопку Выполнить.
  5. Визуализация результатов(рисунок 1). Выполните командную строку:
    "plot(sft$fitIndices[,1], -sign(sft$fitIndices[,3])*sft$fitIndices[,2],
    xlab="Мягкий порог (мощность)",ylab="Масштабная топология Модель соответствия,знак R^2",type="n",
    main = paste("независимость ES_Scale"));
    text(sft$fitIndices[,1], -sign(sft$fitIndices[,3])*sft$fitIndices[,2],
    метки=полномочия,cex=cex1,col="красный");
    abline(h=0.9;col="red")
    plot(sft$fitIndices[,1], sft$fitIndices[,5],
    xlab="Мягкий порог (мощность)",ylab="Средняя связность", type="n",
    main = вставить("подключение ES_Mean"))
    text(sft$fitIndices[,1], sft$fitIndices[,5], labels=powers, cex=cex1,col="red")"
    Нажмите кнопку Выполнить.
    ПРИМЕЧАНИЕ: Предпосылка алгоритма взвешенной корреляционной сети заключается в том, что установленная структура сети совыражений соответствует стандартам критерия топологии без масштаба, повышая ее надежность. Индекс без масштабирования, близкий к 1, указывает на сетевую структуру, которая ближе к сети без масштабирования.
  6. Выберите значение мощности, когда безмасштабный индекс R2 в квадрате больше 0,9 и переходите к следующему шагу анализа.
    ПРИМЕЧАНИЕ: Когда индекс без масштабирования близок к 1, структура сети ближе к сети без масштабирования. При анализе двух или более сетей необходимо сделать так, чтобы каждая сеть была близка к значению мощности сети без масштабирования, чтобы удовлетворить сопоставимость между совместно выраженными сетями.

3. Построение сети коэкспрессии и идентификация модулей

ПРИМЕЧАНИЕ: На основе приведенного выше расчетного значения мощности строится сеть совместного захождения. Ключевые командные строки относятся к дополнению S2.

  1. Используйте функцию смежности в пакете WGCNA для добавления подписанных параметров для построения символьной сети совместного возникновения. Выполните командную строку:
    "смежность = смежность(datExpr0, мощность = мягкая сила)"
    Нажмите кнопку Выполнить.
  2. Примените функцию TOM-similarity для разработки топологической перекрывающейся сети и вычисления сети несходства. Выполните командную строку:
    "TOM = TOMsimilarity(смежность);
    dissTOM = 1-TOM"
    Нажмите кнопку Выполнить.
    ПРИМЕЧАНИЕ: Параметр signed был добавлен для установки типа сети перекрытия топологии.
  3. Используйте функцию hclust для выбора метода иерархической кластеризации средней связи для иерархической кластеризации. Выполните командную строку:
    "geneTree = hclust(as.dist(dissTOM), method = "average");"
    Нажмите кнопку Выполнить.
  4. Используйте функцию cutreeDynamic для выполнения динамической резки ветвей и установите для параметра minClusterSize значение 30. Получение результата распознавания модуля. Выполните командную строку:
    "dynamicMods = cutreeDynamic(dendro = geneTree, distM = dissTOM, deepSplit = 2, pamRespectsDendro = FALSE, minClusterSize = minModuleSize);"
    Нажмите кнопку Выполнить.
    ПРИМЕЧАНИЕ: Минимальный размер модуля не может быть ниже 30.
  5. Вычислите собственный модуль каждого модуля OTUs с помощью функции moduleEigenes. Выполните командную строку:
    "MEList = moduleEigenes(datExpr0, colors = dynamicColors)
    MEs = MEList$eigenes"
    Нажмите кнопку Выполнить.
    ПРИМЕЧАНИЕ: Собственный модуль представлял общий уровень выражения OTU в модуле. Это был не конкретный OTU, а первый основной компонент каждого кластера, полученный путем декомпозиции сингулярного сетевого значения.
  6. Выполнять кластерную функцию на основе коэффициента корреляции собственного модуля. Используйте функцию mergeCloseModules для объединения модулей со значением ниже 0,25. Выполните командную строку:
    "merge = mergeCloseModules(datExpr0, dynamicColors, cutHeight = MEDissThres, verbose = 3)"
    Нажмите кнопку Выполнить.
  7. Наконец, используйте функцию plotDendroAndColors для визуализации, чтобы получить схему отображения назначения модулей каждой сети совмещений(рисунок 2). Используйте функцию таблицы для извлечения атрибуции модуля, соответствующей каждому OTin таблицы назначения модуля. Выполните командную строку:
    "plotDendroAndColors(geneTree, mergedColors, "Merged dynamic",dendroLabels = FALSE,
    hang = 0.03,addGuide = TRUE, guideHang = 0.05,
    main = "ES_Gene дендрограммы и цвета модуля")"
    Нажмите кнопку Выполнить.
    ПРИМЕЧАНИЕ: На схеме назначения модулей совместной экспрессивной сети различные цвета представляют разные модули, а серый представляет OTUs, которые не могут быть классифицированы ни в одном модуле. Большее количество ОТУ в модуле серого цвета указывает на то, что качество предварительной обработки матрицы выражений на ранней стадии является низким.

4. Сравнение модулей

ПРИМЕЧАНИЕ: Этот метод может быть использован для сравнения сетевых модулей двух экологических микробных сообществ. В этой статье сравниваются различия модулей микробной сети между эндосферой и ризопланом, эндосферой и ризосферой, ризосферой и ризопланом.

  1. Тест на сохранность
    1. Загрузите параметры и результаты двух наборов данных, сохраненных на предыдущих шагах.
    2. Установите результат назначения сетевого модуля группы микробных данных в качестве референтной группы, тогда как другую группу в качестве тестовой группы.
    3. Используйте функцию modulePreservation для вычисления значений консервативности статистических параметров Z_summary и medianRank. Выполните командную строку:
      "system.time({mp=modulePreservation(multiExpr,
      multiColor,referenceNetworks=1,
      nПеремещение=100, randomSeed=1,quickCor=0,verbose=3)})"
      Нажмите кнопку Выполнить.
      ПРИМЕЧАНИЕ: Этот результат может количественно определить консервативность между модулями. Z_summary>10 указывает на то, что два модуля хорошо сохранились, тогда как Z_summary<2 обозначает несохраненные модули. medianRank выражает относительную сохранность модуля, оцениваемого по ранжированию. Более высокие значения medianRank обозначают несохраненные модули. (Ключевые командные строки относятся к дополнению S3.)
    4. Используйте функцию графика для визуализации результатов(рисунок 3). Получить параметры Z_summary и medianRank(таблица 1).
      ПРИМЕЧАНИЕ: Сетевые модули, которые удовлетворяют как Z_summary значению менее 2, так и медианному значению Rank в верхней части, являются наиболее сильно несохраняемыми модулями в двух экологических микробных сообществах.
    5. На основании результатов вышеуказанных двух статистических параметров можно выделить модуль с наиболее сильно несохраняемым модулем двух сетей.
  2. Корреляционный анализ членства в модуле
    1. Заданные модульные результаты присвоения двух сетей были установлены в качестве эталонной и тестовой группы соответственно.
      ПРИМЕЧАНИЕ: Настройки должны совпадать с настройками теста сохранения.
    2. Используйте функцию corPvalueStudent для извлечения значения kME (членство в модуле) каждого OTU в нескольких модулях-кандидатах.
      Выполните командную строку:
      "Pvalue = as.data.frame(corPvalueStudent(as.matrix
      (МодульЧленство), Образцы))"
      Нажмите кнопку Выполнить.
      ПРИМЕЧАНИЕ: kME означает степень членства в модуле. ME расшифровывается как module eigen, который представляет собой общий уровень выражения OTU в модуле. kME - коэффициент корреляции между каждым OTU и ME. Количественно оцените важность OTU в сети по значению kME OTU. (Ключевые командные строки относятся к дополнению S4.)
    3. Затем используйте многословную функциюScatterplot для вычисления коэффициента корреляции значения kME соответствующих ОТУ в двух сетях и нарисуйте диаграмму корреляционного анализа(рисунок 4).
      Выполните командную строку:
      "многословныйScatterplot(abs(TModuleMembership
      [ТмодульГены, Тколонн]),
      abs(NModuleMembership[NmoduleGenes, Ncolumn]),
      xlab = paste("kME in", "ES"),
      ylab = paste("kME in", "RP"),
      main = паста("lightyellow"),
      cex.main = 1.7, cex.lab = 1.6, cex.axis = 1.6, col = цвет модуля)"
      Нажмите кнопку Выполнить.
    4. Выберите модуль с наименьшим коэффициентом корреляции значения kME OTU двух сетей. Считайте, что этот модуль имеет наибольшую разницу из двух сетей.

5. Анализ модуля микробной дифференциальной сети

  1. Получение данных о типе доминантных бактерий путем статистического анализа набора последовательностей OTU модуля с наибольшей разницей.
    ПРИМЕЧАНИЕ: Набор последовательностей OTU модуля с наибольшей разностью суммируется таксономией типа. На доминирующий тип бактерий приходилось более 10%.
  2. Затем используйте функцию exportNetworkToCytoscape для получения файла, содержащего информацию о связи взаимодействия OTU в самом большом дифференциальном модуле.
    Выполните командную строку:
    "cyt = exportNetworkToCytoscape(modTOM,
    edgeFile = paste("NEW-ES_CytoscapeInput-edges-", модули , ".txt", sep=""),
    nodeFile = paste("NEW-ES_CytoscapeInput-nodes-", modules, ".txt", sep=""),
    взвешенный = ИСТИНА,порог = 0.5, nodeNames = modProbes,
    altNodeNames = modGenes, nodeAttr = moduleColors[inModule])"
    Нажмите кнопку Выполнить.
  3. Импортируйте файл в Cytoscape. Установите пороговое значение 0,5 и при необходимости настройте другие параметры.
  4. Построение сети совместного возникновения дифференциальных микроорганизмов(рисунок 5).
  5. Получена информация о основном роде, который играет важнейшая регулирующей роль в сети.
    ПРИМЕЧАНИЕ: В соответствии со значением kME OUT, основной род может быть определен.
  6. Наконец, были оценены функции основного рода и проанализировано его влияние на всю сеть различий.

Результаты

Репрезентативные результаты в этой статье были загружены из данных о микробиоме корня риса California Abaker за 2014 год в базе данных NCBI (PRJNA386367)9. Данные включают образцы ризосферы, ризоплана и эндосферного микробиома из рисовых растений, выращенных в течение 14 недель на затопленно?...

Обсуждение

Корреляционные сети все чаще используются в приложениях биоинформатики. WGCNA - это метод системной биологии для описательного анализа отношений между различными элементами биологической системы12. Программный пакет R использовался в более ранних работах над WGCNA13,<...

Раскрытие информации

Авторам нечего раскрывать.

Благодарности

Разработка этой рукописи была поддержана средствами Национального фонда естественных наук Провинции Китай-Гуйчжоу провинциального народного правительства Карстовый исследовательский центр проекта (U1812401), Докторского исследовательского проекта Гуйчжоуского педагогического университета (GZNUD[2017]1), Проекта поддержки науки и техники провинции Гуйчжоу (QKHZC[2021]YB459) и Научно-технического проекта Гуйяна ([2019]2-8).

Авторы хотели бы поблагодарить Edwards J.A et al за предоставление данных о микробиоме риса в общедоступных базах данных и поддержку со стороны TopEdit (www.topeditsci.com) за лингвистическую помощь во время подготовки этой рукописи.

Материалы

NameCompanyCatalog NumberComments
RThe University of Aucklandversion 4.0.2R is a free software environment for statistical computing and graphics. It compiles and runs on a wide variety of UNIX platforms, Windows and MacOS.
RStdioJJ Allaireversion 1.4.1103The RStudio IDE is a set of integrated tools designed to help you be more productive with R and Python.
Cytoscapeversion 3.7.1Cytoscape is an open source software platform for visualizing complex networks and integrating these with any type of attribute data.
NCBI databaseThe National Center for Biotechnology Information advances science and health by providing access to biomedical and genomic information.

Ссылки

  1. Philippot, L., Raaijmakers, J. M., Lemanceau, P., vander Putten, W. H. Going back to the roots: the microbial ecology of the rhizosphere. Nature Reviews Microbiology. 11, 789-799 (2013).
  2. Fierer, N. Embracing the unknown: disentangling the complexities of the soil microbiome. Nature Review Microbiology. 15 (10), 579-590 (2017).
  3. Jin, J., Wang, G. H., Liu, X. B., Liu, J. D., Chen, X. L., Herbert, S. J. Temporal and spatial dynamics of bacterial community in the rhizosphere of soybean genotypes grown in a black soil. Pedosphere. 19 (6), 808-816 (2009).
  4. Ma, B., et al. Genetic correlation network prediction of forest soil microbial functional organization. ISME J. 12 (10), 2492-2505 (2018).
  5. de Vries, F. T., et al. Soil bacterial networks are less stable under drought than fungal networks. Nature Communications. 9 (1), 3033 (2018).
  6. Colin, C., et al. Correlating transcriptional networks to breast cancer survival: a large-scale coexpression analysis. Carcinogenesis. (10), 2300-2308 (2013).
  7. Ma, B., Zhao, K., Lv, X., et al. Genetic correlation network prediction of forest soil microbial functional organization. ISME J. 12, 2492-2505 (2018).
  8. Zhang, B., Horvath, S. A general framework for weighted gene co-expression network analysis. Statistical applications in genetics and molecular biology. 4 (1), (2005).
  9. Edwards, J. A., et al. Compositional shifts in root-associated bacterial and archaeal microbiota track the plant life cycle in field-grown rice. PLoS Biology. 16 (2), 2003862 (2018).
  10. Bashan, Y., De-Bashan, L. E. How the Plant Growth-Promoting Bacterium Azospirillum Promotes Plant Growth-A Critical Assessment. Advances in Agronomy. 108, 77-136 (2010).
  11. Lovley, D. R., et al. Geobacter: The Microbe Electric's Physiology, Ecology, and Practical Applications. Advances in Microbial Physiology. 59, 1 (2011).
  12. Langfelder, P., Horvath, S. WGCNA: an R package for weighted correlation network analysis. BMC Bioinformatics. 9, 559 (2008).
  13. Zhang, B., Horvath, S. A General Framework for Weighted Gene Co-expression Network Analysis. Statistical Applications in Genetics and Molecular Biology. 4 (1), 17 (2005).
  14. Horvath, S., Dong, J. Geometric interpretation of Gene Co-expression Network Analysis. PLoS Computational Biology. 4 (8), 1000117 (2008).
  15. Langfelder, P., Horvath, S. Eigengene networks for studying the relationships between co-expression modules. BMC Systems Biology. 1, 54 (2007).
  16. Horvath, S., et al. Analysis of Oncogenic Signaling Networks in Glioblastoma Identifies ASPM as a Novel Molecular Target. Proceedings of the National Academy of Sciences of the United States of America. 103 (46), 17402-17407 (2006).
  17. Carlson, M. R., et al. and Sequence Conservation: Predictions from Modular Yeast Co-expression Networks. BMC Genomics. 7 (1), 40 (2006).
  18. Fuller, T., et al. Weighted Gene Co-expression Network Analysis Strategies Applied to Mouse Weight. Mammalian Genome. 6 (18), 463-472 (2007).
  19. Yin, L., Wang, Y., Lin, Y., et al. Explorative analysis of the gene expression profile during liver regeneration of mouse: a microarray-based study[J]. Artificial Cells Nanomedicine & Biotechnology. 47 (1), 1113-1121 (2019).
  20. Oldham, M., Horvath, S., Geschwind, D. Conservation and Evolution of Gene Co-expression Networks in Human and Chimpanzee Brains. Proceedings of the National Academy of Sciences of the United States of America. 103 (47), 17973-17978 (2006).
  21. Oldham, M. C., et al. Functional organization of the transcriptome in human brain. Nature Neuroscience. 11 (11), 1271-1282 (2008).
  22. Keller, M. P., et al. A gene expression network model of type 2 diabetes links cell cycle regulation in islets with diabetes susceptibility. Genome Research. 18 (5), 706-716 (2008).
  23. Weston, D., Gunter, L., Rogers, A., Wullschleger, S. Connecting genes, coexpression modules, and molecular signatures to environmental stress phenotypes in plants. BMC Systems Biology. 2 (1), 16 (2008).
  24. Jorda´n, F. Keystone species and food webs. Biological Sciences. 364, 1733-1741 (2009).
  25. Backhed, F., Ley, R. E., Sonnenburg, J. L., Peterson, D. A., Gordon, J. I. Host-Bacterial Mutualism in the Human Intestine. Science. 307, 1915-1920 (2009).

Перепечатки и разрешения

Запросить разрешение на использование текста или рисунков этого JoVE статьи

Запросить разрешение

Смотреть дополнительные статьи

175

This article has been published

Video Coming Soon

JoVE Logo

Исследования

Образование

О JoVE

Авторские права © 2025 MyJoVE Corporation. Все права защищены