该方法可以有效探索不同环境中不同微生物物种的互动关系或共发生网络。它提供了如何使用WGCNA算法构建微生物群共发生网络的细节。此外,根据研究结果,该方法评估微生物关系的差异和微生物财团之间的组成。
下面是方法的基本流程。微生物群的组成和丰度数据从 NCBI 数据库下载,或从样本序列数据中下载。首先,打开 RStudio 软件并安装 WGCNA 软件包。
然后,加载数据并使用良好的样本基因功能来检查数据的正确性。检查符合我们要求的离群值和存储样品。当检查结果属实时,请继续下一步。
保存结果。使用拾取阈值函数计算不同功率值下的数据的刻度自由索引(R 平方)。可视化结果。
当无比例指数接近一个时,网络结构更接近于规模自由网络。当刻度自由指数(R 平方)大于 0.9 时,选择功率值。最后,使用相同的方法分析微生物群的其余数据。
首先,利用邻存函数构建一个象征性的共发生网络。此外,使用 TOM 相似性功能开发拓扑、重叠网络。其次,使用 Hclust 功能执行分层聚类并绘制生成的聚类树。
第三,使用 cutree 动态功能执行动态分支切割,并使用最小集群大小参数设置最小的模块大小。最小的模块大小通常设置在 30 以上。第四,计算每个模块的微生物特征。
分层聚类根据相关系数执行,高度小于 0.25 的模块合并以获取每个模块的分布。第五,使用情节和颜色功能来可视化结果。获得共发生网络模块的分配显示图。
然后,重命名模块颜色并构建与颜色对应的数字标签。保存它们以供后续部件使用。最后,重复上述过程以获得其他数据集。
在此部分,比较和分析两组数据并进行保存测试。首先,加载前几个步骤中保存的两个数据集的参数和结果。然后,将一个数据集的模块结果设置为参考组,将另一个数据集设置为测试组并执行模块比较。
其次,计算保守度、统计参数、Z 汇总值和中位数值,以量化模块之间的保守度。最后,可视化结果。确定满足 Z 汇总值(小于 2 个)和顶部中位数排名值的网络模块。
该模块是两个微生物数据中最未保存的模块。对模块成员进行相关分析。分别将两个网络的模块分配结果设置为参考和测试组。
设置必须与保存测试相同。首先,根据保存测试的结果,在几个候选模块中计算每个 OTU 的 KME 值。以黄色模块为例。
计算两个黄色模块中 KME 值的相关系数,然后绘制模块中 KME 值的相关分析图。最后,根据数字中的相关系数,判断两个数据集中模块的保守性。选择相关系数最小的模块。
首先,使用输出网络到 Cytoscape 功能将网络导出到 Cytoscape 可以读取的边缘和节点列表文件。然后,将文件导入 Cytoscape 中。将阈值设置为 0.5,并根据需要调整其他参数。
最后,获得不同微生物的共同发生网络。在本文中,WGCNA 算法用于分析米根系统三个利基的差异。选择满足接近规模免费网络的三个网络的功率值。
在内圈、日光和日生圈微生物发生网络中,分别识别23、22和21个模型。使用保存测试和相关分析来查找米根系统每个利基之间极不保守的模块。使用不同的颜色为这三个模块构建一个共发生网络,以表示不同的微生物。
蛋白菌、活性细菌、细菌、肌瘤和维鲁科米罗比亚主导着三个不同的微生物网络。此外,17个核心属主要管理这些网络。观看此视频后,您应该很好地了解如何执行一系列步骤,使用 WGCNA 算法分析由于不同生态环境在微生物群落中可能发生的不同共生网络。