JoVE Logo

サインイン

このコンテンツを視聴するには、JoVE 購読が必要です。 サインイン又は無料トライアルを申し込む。

この記事について

  • 要約
  • 要約
  • 概要
  • プロトコル
  • 結果
  • ディスカッション
  • 開示事項
  • 謝辞
  • 資料
  • 参考文献
  • 転載および許可

要約

ネットワーク解析を行い、土壌、水、根層圏などの様々な生態微生物群集の関連を評価しました。WGCNA アルゴリズムを使用して、環境環境の異なる微生物群集で発生する可能性のある、異なる共発生ネットワークを解析する方法に関するプロトコルを紹介します。

要約

根マイクロバイオームは、植物の成長と環境適応に重要な役割を果たしています。ネットワーク解析は、異なる環境で異なる微生物種の相互作用関係または共発生モデルを効果的に探求することができるコミュニティを研究するための重要なツールです。この原稿の目的は、加重相関ネットワークアルゴリズムを使用して、異なる生態学的環境に起因する微生物群集で発生する可能性のある異なる共発生ネットワークを分析する方法の詳細を提供することです。実験の全ての分析はWGCNAパッケージで行われる。WGCNA は重み付け相関ネットワーク分析のための R パッケージです。これらの方法を実証するために使用された実験データは、米(Oryza sativa)ルートシステムの3つのニッチのためのNCBI(国立バイオテクノロジー情報センター)データベースからの微生物群集データであった。加重相関ネットワークアルゴリズムを用いて、3つのニッチのそれぞれに微生物群集の共存在ネットワークを構築しました。その後、エンドスフィア、根葉面、根球土間の差動共存在ネットワークが同定された。また、ネットワーク機能において重要な規制の役割を果たす「WGCNA」パッケージにより、ネットワーク内のコア属が得られました。これらの方法により、環境障害に対する微生物ネットワークの応答を分析し、異なる微生物生態学的応答理論を検証することができます。これらの方法の結果は、米のエンドスフィア、根葉面および根層圏土壌で同定された有意な微分微生物ネットワークを示す。

概要

マイクロバイオーム研究は、生態系プロセス1,2を理解し、操作する上で重要な意味を持つ。微生物集団は、環境変化に対する微生物の応答に影響を与える特性を持つ生態学的ネットワークを相互作用することによって相互接続される3,4.さらに、これらのネットワークの特性は、微生物群集の安定性に影響を及ぼし、土壌機能5と密接に関連している。重み付き遺伝子相関ネットワーク解析は、遺伝子群と微生物群集の関係に関する研究に広く応用されているこれまでの研究では、主に異なる遺伝子または集団のネットワークと外界との関連に焦点を当ててきた7.しかし、環境条件の異なる微生物集団によって形成される相関ネットワークの違いはほとんど調査されていない。本論文では、WGCNAアルゴリズムの迅速な実施に関する洞察と詳細を提供し、異なる環境条件下で収集したマイクロバイオームサンプルの共発生ネットワークを構築することを目的としています。分析結果に基づき、集団の組成と差を評価し、異なる微生物集団間の関係についてさらに議論した。加重相関ネットワークアルゴリズム8の以下の基本流れが適用された。まず、類似度行列は、操作分類単位(OTU)式プロファイル間のピアソン相関係数を計算することによって構築する必要があります。次に、隣接関係関数のパラメータ(パワーまたはシグモイド隣接関数)をスケールフリートポロジ基準で採用し、類似行列を隣接行列に変換し、各共発生ネットワークは隣接行列に対応した。TOM ベースの非類似性と結合した平均リンケージ階層クラスタリングを使用して、一貫した発現プロファイルを持つグループ OTUs をモジュールに組み込んだ。さらに、保守的な統計と関連するパラメータ分析モジュールとの関係を計算し、最終的にモジュール内のハブOTUを特定した。これらの方法は、環境条件の異なる様々な微生物群のネットワーク構造の違いを分析するのに特に適している。本稿では、共発現ネットワーク開発の方法、モジュール間の類似性の分析、及び異なるモジュールネットワークでコア種を得るために適用される手順の手順の概要を詳細に説明した。

プロトコル

1. データダウンロード

  1. NCBI データベースを形成する PRJNA386367 のデータをダウンロードします。2014年にカリフォルニア州アーバックルの水没した田んぼで、14週間栽培された稲植物の根茎、根葉樹、およびエンドスフィアマイクロバイオームデータを受動PRJNA386367のデータから選択します。
    注:根茎、根葉、および内陸性微生物叢のデータは、OTUsテーブルによって受付PRJNA386367で提示されました。

2. 最適な電力価値の決定

注: WGCNA パッケージには、次の機能パラメータがすべて含まれています。WGCNA は重み付け相関ネットワーク分析のための R パッケージです。キーコマンドラインは 補足 S1を参照してください。

  1. R 言語環境で Rstudio ソフトウェアを開き、WGCNA パッケージをインストールします。
  2. データを読み込み、良好なサンプルを使用してデータの正確性を確認します。コマンド ラインを実行します。
    "gsg = 良いサンプル(ダテックスプレ0、詳細 = 3)
    gsg$allOK "
    [ ファイルを実行 ]をクリックします。
  3. 外れ値を確認し、要件を満たすサンプルを保存します。チェック結果が TRUE の場合は、次の手順に進みます。結果を保存します。
  4. PickSoftThreshold 関数を使用して、異なる電力値の下でデータの 2 つのグループのスケールフリー インデックス R2 を計算します。コマンド ラインを実行します。
    "sft = ピックソフトスレッシュ(datExpr0、パワーベクトル =パワー、冗長 = 5)"
    [ ファイルを実行 ]をクリックします。
  5. 結果を視覚化します (図 1)。コマンド ラインを実行します。
    "プロット(sft$fitIndices[,1],,-sign(sft$fitIndices[,3])*sft$fitIndices[,2]、
    xlab="ソフトしきい値(パワー)"、ylab="スケールフリートポロジモデルフィット、署名されたR^2"、タイプ="n"、
    main = ペースト(「ES_Scale独立」)
    テキスト(sft$fitIndices[,1], -sign(sft$fitIndices[,3])*sft$fitIndices[,2],
    ラベル=パワー、cex=cex1、コル="赤";
    アバーリン(h=0.9,col="red")
    プロット(sft$フィットインディクティク[,1],sft$fitIndices[,5])
    xlab="ソフトしきい値(パワー)"、ylab="平均接続"、タイプ="n"、
    main = 貼り付け(「接続性ES_Mean)」
    テキスト(sft$fitIndices[,1],sft$fitIndices[,5],ラベル=パワー,cex=cex1,col="赤")
    [ ファイルを実行 ]をクリックします。
    注: 重み付け相関ネットワーク アルゴリズムの前提は、確立された共式ネットワーク構造がスケールフリー トポロジ基準の標準に準拠し、その堅牢性を高めることです。スケールフリーインデックスが1に近い場合は、スケールフリーネットワークに近いネットワーク構造を示します。
  6. スケールフリーインデックスR2 が0.9より大きい場合の電力値を選択し、次の分析ステップに進みます。
    注: スケールフリーインデックスが 1 に近い場合、ネットワーク構造はスケールフリーネットワークに近くなります。複数のネットワークを解析する場合、各ネットワークをスケールフリーネットワークの電力値に近づけ、共表明ネットワーク間の比較可能性を満たすことを選択する必要があります。

3. 共式ネットワークの構築とモジュール識別

注: 上記の計算された電力値に基づいて、共オカレンス ネットワークが構築されます。主要なコマンド ラインは 補足 S2を参照してください。

  1. WGCNA パッケージの隣接関係関数を使用して、シンボルコオカレンスネットワークの構築に署名付きパラメータを追加します。コマンド ラインを実行します。
    「隣接性=隣接性(datExpr0、パワー=ソフトパワー)」
    [ ファイルを実行 ]をクリックします。
  2. TOM-類似性関数を適用してトポロジの重なり合うネットワークを開発し、非類似性ネットワークを計算します。コマンド ラインを実行します。
    「TOM = 相似性(隣接性);
    ディストム = 1-TOM"
    [ ファイルを実行 ]をクリックします。
    注: トポロジ オーバーラップ ネットワーク タイプを設定するために、符号付きパラメータが追加されました。
  3. hclust 関数を使用して、階層クラスタリングの平均リンケージ階層クラスタリング方法を選択します。コマンド ラインを実行します。
    "遺伝子ツリー = hclust(as.dist(ディストム)、メソッド = "平均");
    [ ファイルを実行 ]をクリックします。
  4. 動的分岐の切り取り処理を実行し、minClusterSize パラメーターを 30 に設定するには、cutreeDynamic 関数を使用します。モジュール認識結果を取得します。コマンド ラインを実行します。
    "ダイナミックモッズ = クツリーダイナミック(デンドロ = ジーンツリー、distM = ディストム、ディープスプリット = 2、パマリクスデンドロ = FALSE、ミンクラスタサイズ = minModuleSize);」
    [ ファイルを実行 ]をクリックします。
    メモ:モジュールの最小サイズを30以下にすることはできません。
  5. 各OTUsモジュールのモジュール固有値を、モジュール固有遺伝子関数で計算します。コマンド ラインを実行します。
    "MEList = モジュール固有遺伝子(datExpr0, 色 = ダイナミックカラー)
    ME = MEリスト $エイゲンゲネス"
    [ ファイルを実行 ]をクリックします。
    メモ: モジュール固有値は、モジュール内の全体的な OTU 式レベルを表しています。特定のOTUではなく、単数形のネットワーク値分解によって得られた各クラスタの最初の主成分であった。
  6. モジュール固有の相関係数に基づいてクラスタ機能を実行します。mergeCloseModules 関数を使用して、モジュールを 0.25 より小さい値でマージします。コマンド ラインを実行します。
    "マージ = マージ閉じるモジュール(datExpr0、ダイナミックカラー、カット高さ = MEDissThres、詳細 = 3)"
    [ ファイルを実行 ]をクリックします。
  7. 最後に、視覚化用 plotDendroAndColors 関数を使用して、各共式ネットワークのモジュール割り当て表示図を取得します (図 2)。表関数を使用して、モジュール割り当てテーブルの各 OT に対応するモジュールアトリビューションを抽出します。コマンド ラインを実行します。
    "プロットデンドロアンドColors(遺伝子ツリー、マージされた色、"マージされたダイナミック"、デンドロラベル= FALSE、
    ハング = 0.03,追加ガイド = TRUE,ガイドハング = 0.05,
    main = "ES_Geneデンドログラムとモジュールの色")
    [ ファイルを実行 ]をクリックします。
    注: 共表現ネットワークのモジュール割り当て図では、異なる色は異なるモジュールを表し、灰色はどのモジュールにも分類できない OTUS を表します。グレーモジュールの OTUs の数が多いほど、式行列の初期段階の前処理品質が悪いことが示されます。

4. モジュール比較

注: この方法は、2 つの生態微生物群集のネットワーク モジュールを比較するために使用できます。本稿では、内層と根葉、内層圏、根球、根球、根葉面の間の微生物ネットワークモジュールの違いを比較する。

  1. 保存試験
    1. 前のステップで保存された 2 つのデータ・セットのパラメーターと結果をロードします。
    2. 微生物データのグループのネットワークモジュール割り当て結果を参照グループとして設定し、他方のグループをテストグループとして設定します。
    3. モジュール保存関数を使用して、保守的な統計パラメータZ_summaryと中央値ランクの値を計算します。コマンド ラインを実行します。
      "システム.time({mp=モジュール保存(マルチエックスプ
      マルチカラー、リファレンスネットワーク=1、
      nPermutation=100,ランダムシード=1,クイックコー=0,冗長=3))
      [ ファイルを実行 ]をクリックします。
      注: この結果はモジュール間の保守性を定量化できます。Z_summary>10 は、2 つのモジュールが高度に保存されていることを示し、Z_summary<2 は非保存モジュールを示します。medianRankは、ランク付けによって評価されるモジュールの相対的な保存を表します。中央値が高いほど、保存されていないモジュールを示します。(キーコマンドラインは 補足 S3を参照してください。
    4. プロット関数を使用して結果を視覚化します (図 3)。パラメーター Z_summaryと中央値のランクを取得します (表 1)。
      注: 2 未満のZ_summary値と上部の中央値のランク値の両方を満たすネットワーク モジュールは、2 つの生態学的微生物群集の中で最も高い非保存モジュールです。
    5. 前述の2つの統計パラメータの結果に基づいて、2つのネットワークの最も高く保存されていないモジュールを有するモジュールを識別する。
  2. モジュールメンバーシップの相関分析
    1. 2つのネットワークのモジュール割り当て結果をそれぞれ基準として設定し、テストグループを設定する。
      注: 設定は、保存テストと同じである必要があります。
    2. corPvalueStudent 関数を使用して、各 OTU の kME (モジュール メンバーシップ) 値を複数の候補モジュールで抽出します。
      コマンド ラインを実行します。
      "Pvalue = as.data.frame(コプバリュースチューデント(マトリックスとして)
      (モジュールメンバーシップ)、サンプル)"
      [ ファイルを実行 ]をクリックします。
      注意: kME はモジュールメンバーシップの程度を表します。ME はモジュール固有の意味で、モジュール内の OTU 式の全体的なレベルを表します。kME は、各 OTU と ME の間の相関係数です。OTU の kME 値でネットワークにおける OTU の重要性を定量化します。(キーコマンドラインは 補足 S4を参照してください。
    3. 次に、2つのネットワーク内の対応するOTUsのkME値の相関係数を計算し、相関分析図を描くために、verboseScatterplot関数を使用します(図4)。
      コマンド ラインを実行します。
      「冗長散乱プロット(アブス(TModuleメンバーシップ)
      [Tモジュール遺伝子、Tcolumn])
      abs(N モジュールメンバーシップ[N モジュール遺伝子、Ncolumn])
      xlab = ペースト("kME in"、"ES")、
      ylab = ペースト("kME in","RP"),
      メイン = ペースト(「ライトイエロー」)
      cex.main = 1.7、 cex.lab = 1.6、cex.軸 = 1.6、col = モジュールカラー)
      [ ファイルを実行 ]をクリックします。
    4. 2つのネットワークのOTUのkME値の最小相関係数を持つモジュールを選択します。このモジュールは、2 つのネットワークの最大の違いを持つ場合を考えます。

5. 微生物差動ネットワークモジュールの解析

  1. 最も大きな差を持つモジュールのOTU配列セットの統計解析を通じて、支配細菌フィラのデータを取得します。
    注: 最大の差異を持つモジュールの OTU シーケンス セットは、phyla の分類によって合計されます。支配的な細菌フィラは10%以上を占めた。
  2. 次に、exportNetworkToCytoscape関数を使用して、最大の差動モジュール内のOTUの相互作用関係情報を含むファイルを取得します。
    コマンド ラインを実行します。
    "シト = エクスポートネットワークToCytoscape(モッズム)
    エッジファイル =ペースト(「新しいES_CytoscapeInputエッジ-」、モジュール、".txt"、sep=")
    ノードファイル = ペースト(「new-ES_CytoscapeInputノード-」、モジュール、「.txt」、sep=")
    重み付け = TRUE、しきい値 = 0.5、ノード名 = モッドプローブ、
    アルトノードネーム = モッズインジュネス、ノードアトル = モジュールカラー[inModule]]
    [ ファイルを実行 ]をクリックします。
  3. ファイルを Cytoscape にインポートします。しきい値を 0.5 に設定し、必要に応じて他のパラメーターを調整します。
  4. 微分微生物の共発生ネットワークを構築する(図5)。
  5. ネットワークにおいて最も重要な規制上の役割を持つコア属の情報を取得。
    注: OUT の kME 値に従って、コアの属を定義できます。
  6. 最後に、コア属の機能を評価し、その影響がネットワーク全体に及ぼす影響を分析した。

結果

この記事の代表的な結果は、NCBI データベース (PRJNA386367)9の 2014 カリフォルニア・アベーカー米根マイクロバイオームデータからダウンロードされました。データには、水没した田んぼで14週間栽培された稲原の根茎、根茎、およびエンドスフィア微生物叢サンプルが含まれています。WGCNA アルゴリズムを使用して、スケールフリーネットワークに近い 3 つのネットワークを...

ディスカッション

相関ネットワークはバイオインフォマティクスアプリケーションでますます使用されています。WGCNAは、生物系12の様々な要素間の関係を記述的に分析するためのシステム生物学法である。R ソフトウェア パッケージは、WGCNA13、 1415の以前の作業で使用されていました。このパッケージには、ネットワ?...

開示事項

著者らは開示するものは何もない。

謝辞

この原稿の開発は、中国・貴州省人民政府カルスト科学研究センタープロジェクト(U1812401)、貴州師範大学博士研究プロジェクト(GZNUD[GZNUD)の資金によって支援されました[ 2017年)、貴州省の科学技術支援プロジェクト(QKHZC[2021]YB459)、貴陽の科学技術プロジェクト([2019]2-8)。

著者らは、公開データベースで米のマイクロバイオームデータを提供し、この原稿の準備中にTopEdit(www.topeditsci.com)からの言語援助を支援してくれたエドワーズJ.Aららに感謝したいと考えています。

資料

NameCompanyCatalog NumberComments
RThe University of Aucklandversion 4.0.2R is a free software environment for statistical computing and graphics. It compiles and runs on a wide variety of UNIX platforms, Windows and MacOS.
RStdioJJ Allaireversion 1.4.1103The RStudio IDE is a set of integrated tools designed to help you be more productive with R and Python.
Cytoscapeversion 3.7.1Cytoscape is an open source software platform for visualizing complex networks and integrating these with any type of attribute data.
NCBI databaseThe National Center for Biotechnology Information advances science and health by providing access to biomedical and genomic information.

参考文献

  1. Philippot, L., Raaijmakers, J. M., Lemanceau, P., vander Putten, W. H. Going back to the roots: the microbial ecology of the rhizosphere. Nature Reviews Microbiology. 11, 789-799 (2013).
  2. Fierer, N. Embracing the unknown: disentangling the complexities of the soil microbiome. Nature Review Microbiology. 15 (10), 579-590 (2017).
  3. Jin, J., Wang, G. H., Liu, X. B., Liu, J. D., Chen, X. L., Herbert, S. J. Temporal and spatial dynamics of bacterial community in the rhizosphere of soybean genotypes grown in a black soil. Pedosphere. 19 (6), 808-816 (2009).
  4. Ma, B., et al. Genetic correlation network prediction of forest soil microbial functional organization. ISME J. 12 (10), 2492-2505 (2018).
  5. de Vries, F. T., et al. Soil bacterial networks are less stable under drought than fungal networks. Nature Communications. 9 (1), 3033 (2018).
  6. Colin, C., et al. Correlating transcriptional networks to breast cancer survival: a large-scale coexpression analysis. Carcinogenesis. (10), 2300-2308 (2013).
  7. Ma, B., Zhao, K., Lv, X., et al. Genetic correlation network prediction of forest soil microbial functional organization. ISME J. 12, 2492-2505 (2018).
  8. Zhang, B., Horvath, S. A general framework for weighted gene co-expression network analysis. Statistical applications in genetics and molecular biology. 4 (1), (2005).
  9. Edwards, J. A., et al. Compositional shifts in root-associated bacterial and archaeal microbiota track the plant life cycle in field-grown rice. PLoS Biology. 16 (2), 2003862 (2018).
  10. Bashan, Y., De-Bashan, L. E. How the Plant Growth-Promoting Bacterium Azospirillum Promotes Plant Growth-A Critical Assessment. Advances in Agronomy. 108, 77-136 (2010).
  11. Lovley, D. R., et al. Geobacter: The Microbe Electric's Physiology, Ecology, and Practical Applications. Advances in Microbial Physiology. 59, 1 (2011).
  12. Langfelder, P., Horvath, S. WGCNA: an R package for weighted correlation network analysis. BMC Bioinformatics. 9, 559 (2008).
  13. Zhang, B., Horvath, S. A General Framework for Weighted Gene Co-expression Network Analysis. Statistical Applications in Genetics and Molecular Biology. 4 (1), 17 (2005).
  14. Horvath, S., Dong, J. Geometric interpretation of Gene Co-expression Network Analysis. PLoS Computational Biology. 4 (8), 1000117 (2008).
  15. Langfelder, P., Horvath, S. Eigengene networks for studying the relationships between co-expression modules. BMC Systems Biology. 1, 54 (2007).
  16. Horvath, S., et al. Analysis of Oncogenic Signaling Networks in Glioblastoma Identifies ASPM as a Novel Molecular Target. Proceedings of the National Academy of Sciences of the United States of America. 103 (46), 17402-17407 (2006).
  17. Carlson, M. R., et al. and Sequence Conservation: Predictions from Modular Yeast Co-expression Networks. BMC Genomics. 7 (1), 40 (2006).
  18. Fuller, T., et al. Weighted Gene Co-expression Network Analysis Strategies Applied to Mouse Weight. Mammalian Genome. 6 (18), 463-472 (2007).
  19. Yin, L., Wang, Y., Lin, Y., et al. Explorative analysis of the gene expression profile during liver regeneration of mouse: a microarray-based study[J]. Artificial Cells Nanomedicine & Biotechnology. 47 (1), 1113-1121 (2019).
  20. Oldham, M., Horvath, S., Geschwind, D. Conservation and Evolution of Gene Co-expression Networks in Human and Chimpanzee Brains. Proceedings of the National Academy of Sciences of the United States of America. 103 (47), 17973-17978 (2006).
  21. Oldham, M. C., et al. Functional organization of the transcriptome in human brain. Nature Neuroscience. 11 (11), 1271-1282 (2008).
  22. Keller, M. P., et al. A gene expression network model of type 2 diabetes links cell cycle regulation in islets with diabetes susceptibility. Genome Research. 18 (5), 706-716 (2008).
  23. Weston, D., Gunter, L., Rogers, A., Wullschleger, S. Connecting genes, coexpression modules, and molecular signatures to environmental stress phenotypes in plants. BMC Systems Biology. 2 (1), 16 (2008).
  24. Jorda´n, F. Keystone species and food webs. Biological Sciences. 364, 1733-1741 (2009).
  25. Backhed, F., Ley, R. E., Sonnenburg, J. L., Peterson, D. A., Gordon, J. I. Host-Bacterial Mutualism in the Human Intestine. Science. 307, 1915-1920 (2009).

転載および許可

このJoVE論文のテキスト又は図を再利用するための許可を申請します

許可を申請

さらに記事を探す

175

This article has been published

Video Coming Soon

JoVE Logo

個人情報保護方針

利用規約

一般データ保護規則

研究

教育

JoVEについて

Copyright © 2023 MyJoVE Corporation. All rights reserved