生物医学的報告による疾患におけるオルガネラ経路の役割を解明するためのナレッジグラフアプローチ

Please note that all translations are automatically generated. Click here for the English version.

1.5K Views

•

07:35 min

•

October 13th, 2023

DOI :

10.3791/65084-v

October 13th, 2023

•

Alexander R. Pelletier¹^,²^,³, Dylan Steinecke¹^,³^,⁴, Dibakar Sigdel¹, Irsyad Adam¹, J. Harry Caufield¹, Vladimir Guevara-Gonzalez¹, Joseph Ramirez¹, Aarushi Verma¹, Kaitlyn Bali¹, Katherine Downs¹, Wei Wang¹^,²^,³, Alex Bui³^,⁴, Peipei Ping¹^,²^,³^,⁴^,⁵

¹Department of Physiology, UCLA School of Medicine, ²Scalable Analytics Institute (ScAi) at Department of Computer Science, UCLA School of Engineering, ³NIH BRIDGE2AI Center at UCLA & NHLBI Integrated Cardiovascular Data Science Training Program, UCLA, ⁴Medical Informatics, University of California at Los Angeles (UCLA), ⁵Department of Medicine (Cardiology), UCLA School of Medicine

文字起こし

この計算プロトコルは、生物医学出版物で報告されているように、細胞成分、例えばミトコンドリアタンパク質とそれらの疾患との関連との間の関連を調査することを可能にするので重要である。CaseOLAP LIFTは、研究者が生物医学レポートやナレッジベースから情報を抽出して統合できるようにします。ナレッジグラフとして整理されたこれらの結果は、新しい関係を予測するために活用できます。

これらの研究結果は、特定および予測されたタンパク質疾患関連の優先順位付きリストを強調することにより、仮説の生成をサポートし、疾患の病理と治療に関する新しい洞察を明らかにするのに役立ちます。この高度にカスタマイズ可能なワークフローは、GO用語を介して任意の細胞コンポーネントに適用でき、任意の発行日範囲内のMeSH用語を介して疾患の任意のリストに適用できます。このユーザーフレンドリーなプロトコルは、分析に必要な計算の専門知識を最小限に抑えます。

ソフトウェアはDockerコンテナとしてリリースされ、実行に必要なのは十分な計算ストレージとリソースのみです。まず、ターミナルウィンドウを開いて CaseOLAP LIFT ドッカーコンテナーをダウンロードし、「ドッカープル CaseOLAP スラッシュ CaseOLAP_LIFT 最新」と入力します。すべてのプログラムデータと出力を格納するディレクトリを作成します。

画面に表示されているコマンドを使用して docker コンテナーを起動し、フォルダーの完全なファイルパスとして PATH_TO_FOLDER を置き換えます。コンテナ内でElasticsearchを開始するには、新しいターミナルウィンドウを開き、画面に表示されるコマンドを入力します。CaseOLAP_LIFTフォルダーに移動します。

ダウンロードリンクと設定スラッシュがknowledge_base_linksことを確認してください。JSON は、各ナレッジベースリソースの最新バージョンに対して最新かつ正確です。遺伝子オントロジーまたはGO用語を決定するには、Webサイトにアクセスしてください遺伝学.

org をクリックし、すべての GO 用語の識別子を見つけます。同様に、画面に表示されているWebサイトから、医療主題ヘッダーまたはMeSH識別子を介して疾患カテゴリを見つけます。前処理モジュールを実行するには、ダッシュCフラグを使用してユーザー定義の学習済みGO用語を示し、ダッシュDフラグを使用して疾患MeSHツリー番号を示し、ダッシュAフラグで略語を指定します。

テキストマイニングモジュールを実行するには、「Python、スペース、CaseOLAP_LIFT」と入力します。py、スペース、text_mining、ダッシュLフラグを追加して未分類のドキュメントのトピックを補完し、ダッシュTフラグを追加して疾患関連ドキュメントの全文をダウンロードします。テキストマイニングの結果が結果フォルダーにあることを確認します。

すべてのタンパク質を分析して機能的に関連するすべてのタンパク質を含めるか、コアタンパク質を分析してGO項関連タンパク質のみを含めるかを指定して、分析に使用するテキストマイニング結果を指定します。各疾患の上位タンパク質と経路を特定するために、CaseOLAPスコアは各疾患カテゴリ内でZスコア変換されます。ダッシュ Z フラグを指定して、それを超えるとタンパク質が有意と見なされる指定されたしきい値スコアを示します。

解析結果を確認し、必要に応じて調整します。ファイルz_score_cutoff_tableを開きます。csv: 各疾患カテゴリに有意なタンパク質の数を含む生成された Z スコア表を表示します。

これは、適切な Z スコアしきい値を選択するようにユーザーに通知するのに役立ちます。結果フォルダーを開き、前処理で生成されたフォルダーを含む必要なファイルがフォルダー内にあることを確認します。コアタンパク質フォルダー内のすべてのタンパク質を確認します。

知識グラフを設計するには、MeSH 疾患ツリーを MeSH フラグを含めて含めます。PPIフラグを含むストリングからのタンパク質間相互作用、PWフラグを含む共有リアクトーム経路、およびTFDフラグを含むGRNdb GTExからの転写因子依存性。ナレッジグラフ構築モジュールを実行して、コアタンパク質の分析を指定して、GO項に関連するタンパク質のみを含めます。

エッジの重みをスケーリングするには、既定の CaseOLAP スコアではなく、負でない Z スコアにスケール Z スコアを使用します。出力を確認し、ナレッジグラフファイルがmerged_edgesことを確認します。TSVとmerged_nodes。

TSV ファイルが存在します。最後に、画面に表示されるコマンドを入力して、タンパク質疾患の関連を予測するためのナレッジグラフ予測スクリプトを実行します。この図は、各疾患カテゴリーに有意なミトコンドリアタンパク質を示しています。

Zスコア変換を各カテゴリ内のCaseOLAPスコアに適用し、3の閾値を使用して有意なタンパク質を同定しました。各疾患カテゴリーに有意なタンパク質の総数は、各バイオリンプロットの上に示されています。これらのタンパク質のリアクトーム経路分析により、すべての疾患に重要な12の経路が明らかになりました。

この図には、疾患固有の知識グラフに深層学習を適用した例を示します。タンパク質と疾患の間の隠れた関係が予測され、両方の予測の計算された確率が0から1の範囲の値でここに表示されます(1は強い予測を示します)。指定されたシーケンスは、このプロトコル、特に前処理モジュールとテキストマイニングモジュールの実行に不可欠です。

これらの2つのステップは、各疾患の上位タンパク質と経路の特定、および疾患固有の知識グラフの構築に直接影響します。得られた知識グラフは、Neo4jやCytoscapeなどのグラフツールによって効果的に視覚化され、新しい関係の高度な深層学習予測に活用できます。CaseOLAP LIFTは、あらゆる細胞成分と疾患カテゴリーとの関連の研究を可能にします。

結果として得られる知識グラフとランク付けされたタンパク質疾患の関連は、自然言語処理とフォローアップグラフベースの分析をサポートします。

要約

さらに動画を探す

この動画の章

0:04

Introduction

1:09

Running the Docker Container

1:53

Preparing the Diseases and Proteins

3:16

Analyzing the Results

4:20

Predictive Analysis

5:40

Results: Top Protein‐Disease and Pathway‐Disease Associations and Application of Deep Learning for Knowledge Graph Completion

6:40

Conclusion

関連動画

article

人間のゲノムとモデル生物遺伝学情報を統合するWebベースのツール、MARRVELのナビゲート

9.6K Views

article

ショウジョウバエを用した疾患関連希少ヒト変異体の生体内機能的研究

13.6K Views

article

代謝経路情報のGWAS解析のための経路関連研究ツール

3.2K Views

article

ヒト肝細胞癌患者由来オルガノイドモデルの開発と最適化による標的同定と創薬

1.5K Views

article

ヒト肝細胞癌患者由来オルガノイドモデルの開発と最適化による標的同定と創薬

1.5K Views

article

ヒト肝細胞癌患者由来オルガノイドモデルの開発と最適化による標的同定と創薬

1.5K Views

article

細菌機能ネットワークとPathwaysでのマッピング

46.4K Views

article

臨床症例を有効にするためのメタデータ抽出アプローチ先端医学の概念の理解

15.7K Views

article

生成高品質の機械可読の生物学的経路のためのWebツール

17.4K Views

article

遺伝子を使用するプロトコル設定トランスレーショナルリサーチの適切な動物モデルを識別するために濃縮分析

17.7K Views

Copyright © 2023 MyJoVE Corporation. All rights reserved