A subscription to JoVE is required to view this content. Sign in or start your free trial.

In This Article

  • Summary
  • Abstract
  • Introduction
  • Protocol
  • النتائج
  • Discussion
  • Disclosures
  • Acknowledgements
  • Materials
  • References
  • Reprints and Permissions

Summary

نقدم سير عمل مرن وقابل للتمديد قائم على Jupyter-lab للتحليل غير الخاضع للإشراف لمجموعات البيانات المعقدة متعددة الأوميكس التي تجمع بين خطوات المعالجة المسبقة المختلفة ، وتقدير نموذج تحليل العوامل متعددة الأوميكس ، والعديد من التحليلات النهائية.

Abstract

عادة ما تكون آليات المرض معقدة ويحكمها تفاعل العديد من العمليات الجزيئية المتميزة. تعد مجموعات البيانات المعقدة والمتعددة الأبعاد موردا قيما لتوليد المزيد من الأفكار حول تلك العمليات ، ولكن تحليل مجموعات البيانات هذه يمكن أن يكون صعبا بسبب الأبعاد العالية الناتجة ، على سبيل المثال ، عن ظروف مرضية مختلفة ، ونقاط زمنية ، وأوميكس تلتقط العملية بدقة مختلفة.

هنا ، نعرض نهجا لتحليل واستكشاف مجموعة بيانات multiomics المعقدة هذه بطريقة غير خاضعة للإشراف من خلال تطبيق تحليل عامل متعدد الأوميكس (MOFA) على مجموعة بيانات تم إنشاؤها من عينات الدم التي تلتقط الاستجابة المناعية في متلازمات الشريان التاجي الحادة والمزمنة. تتكون مجموعة البيانات من عدة مقايسات بدقة مختلفة ، بما في ذلك بيانات السيتوكين على مستوى العينة ، وبروتينات البلازما ، و العدلات الأولية ، وبيانات RNA-seq أحادية الخلية (scRNA-seq). يضاف المزيد من التعقيد من خلال قياس عدة نقاط زمنية مختلفة لكل مريض والعديد من المجموعات الفرعية للمرضى.

يحدد سير عمل التحليل كيفية دمج البيانات وتحليلها في عدة خطوات: (1) المعالجة المسبقة للبيانات ومواءمتها ، (2) تقدير نموذج MOFA ، (3) التحليل النهائي. توضح الخطوة 1 كيفية معالجة ميزات أنواع البيانات المختلفة ، وتصفية الميزات منخفضة الجودة ، وتطبيعها لتنسيق توزيعاتها لمزيد من التحليل. توضح الخطوة 2 كيفية تطبيق نموذج MOFA واستكشاف مصادر التباين الرئيسية داخل مجموعة البيانات عبر جميع omics والميزات. تقدم الخطوة 3 عدة استراتيجيات لتحليل المصب للأنماط التي تم التقاطها ، وربطها بظروف المرض والعمليات الجزيئية المحتملة التي تحكم تلك الحالات.

بشكل عام ، نقدم سير عمل لاستكشاف البيانات غير الخاضعة للإشراف لمجموعات البيانات المعقدة متعددة الأوميكس لتمكين تحديد محاور الاختلاف الرئيسية المكونة من ميزات جزيئية مختلفة يمكن تطبيقها أيضا على سياقات أخرى ومجموعات بيانات متعددة الأوميكس (بما في ذلك المقايسات الأخرى كما هو موضح في حالة الاستخدام المثالي).

Introduction

عادة ما تكون آليات المرض معقدة ويحكمها تفاعل العديد من العمليات الجزيئية المتميزة. إن فك رموز الآليات الجزيئية المعقدة التي تؤدي إلى أمراض معينة أو تحكم تطور المرض هي مهمة ذات أهمية طبية عالية لأنها قد تكشف عن رؤى جديدة لفهم الأمراض وعلاجها.

تمكن التطورات التكنولوجية الحديثة من قياس تلك العمليات على دقة أعلى (على سبيل المثال ، على مستوى الخلية الواحدة) وعلى طبقات بيولوجية مختلفة (على سبيل المثال ، الحمض النووي ، mRNA ، إمكانية الوصول إلى الكروماتين ، مثيلة الحمض النووي ، البروتينات) في نفس الوقت. وهذا يؤدي إلى زيادة توليد مجموعات البيانات البيولوجية الكبيرة متعددة الأبعاد ، والتي يمكن تحليلها بشكل مشترك لتو....

Protocol

1. الاستعدادات: الإعداد الفني والتثبيت

ملاحظة: لتشغيل هذا البرنامج ، قم بتثبيت wget و git و Apptainer مسبقا على الجهاز. يتم إعطاء دليل لتثبيت Apptainer على أنظمة مختلفة (Linux و Windows و Mac) هنا: https://apptainer.org/docs/admin/main/installation.html. يمكن العثور على معلومات التثبيت على git هنا: https://git-scm.com/book/en/v2/Getting-Started-Installing-Git. اعتمادا على حجم مجموعات بيانات الإدخال المختلفة ، يوصى بتشغيل سير العمل على جهاز مناسب (16 وحدة معالجة مركزية ، ذاكرة 64 جيجابايت). يمكن إجراء اختبار دخان مع بيانات المثال المقدمة على الجهاز المحلي. وترد التعليمات والنواتج المتوقعة من ت....

النتائج

بعد التنفيذ الناجح لسير العمل ، يتم إنشاء العديد من الجداول والأشكال كما هو موضح في الشكل 2. يتم وضع الأشكال في مجلد / الأشكال (الشكل 6 ، الشكل 7 ، الشكل 8 ، الشكل التكميلي 1 ، الشكل التكم?.......

Discussion

باستخدام البروتوكول المحدد ، يتم تقديم سير عمل معياري وقابل للتمديد قائم على دفتر ملاحظات Jupyter يمكن استخدامه لاستكشاف مجموعة بيانات معقدة متعددة الأوميكس بسرعة. تتكون الأجزاء الرئيسية من تدفق العمل من جزء المعالجة المسبقة وتنسيق البيانات (تقديم خطوات قياسية مختلفة لتص.......

Disclosures

يعلن أصحاب البلاغ عدم وجود تضارب في المصالح.

Acknowledgements

يتم دعم C.L. من قبل جمعية هيلمهولتز في إطار مدرسة الأبحاث المشتركة "مدرسة ميونيخ لعلوم البيانات - MUDS".

....

Materials

NameCompanyCatalog NumberComments
ApptainerNANAhttps://apptainer.org/docs/admin/main/installation.html
Compute server or workstation or cloud  (Linux, Mac or Windows environment).
Depending on the size of the different input datasets we recommend running the workflow on a suitable machine (in our setting we use: 16 CPU, 64GB Memory)
Any manufacturer16 CPU, 64GB MemoryLarge Memory is only required for the processing of the raw single cell data. After preprocessing the later analysis steps can also be performed on regular desktop or laptop computers
gitNANAhttps://git-scm.com/book/en/v2/Getting-Started-Installing-Git
GitHubGitHubNAhttps://github.com/heiniglab/mofa_workflow

References

  1. Lähnemann, D., et al. Eleven grand challenges in single-cell data science. Genome Biol. 21 (1), 31 (2020).
  2. Colomé-Tatché, M., Theis, F. J. Statistical single cell multi-omics integration. Curr Opin Syst ....

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Explore More Articles

MOFA

This article has been published

Video Coming Soon

JoVE Logo

Privacy

Terms of Use

Policies

Research

Education

ABOUT JoVE

Copyright © 2025 MyJoVE Corporation. All rights reserved