A subscription to JoVE is required to view this content. Sign in or start your free trial.
Method Article
نقدم سير عمل مرن وقابل للتمديد قائم على Jupyter-lab للتحليل غير الخاضع للإشراف لمجموعات البيانات المعقدة متعددة الأوميكس التي تجمع بين خطوات المعالجة المسبقة المختلفة ، وتقدير نموذج تحليل العوامل متعددة الأوميكس ، والعديد من التحليلات النهائية.
عادة ما تكون آليات المرض معقدة ويحكمها تفاعل العديد من العمليات الجزيئية المتميزة. تعد مجموعات البيانات المعقدة والمتعددة الأبعاد موردا قيما لتوليد المزيد من الأفكار حول تلك العمليات ، ولكن تحليل مجموعات البيانات هذه يمكن أن يكون صعبا بسبب الأبعاد العالية الناتجة ، على سبيل المثال ، عن ظروف مرضية مختلفة ، ونقاط زمنية ، وأوميكس تلتقط العملية بدقة مختلفة.
هنا ، نعرض نهجا لتحليل واستكشاف مجموعة بيانات multiomics المعقدة هذه بطريقة غير خاضعة للإشراف من خلال تطبيق تحليل عامل متعدد الأوميكس (MOFA) على مجموعة بيانات تم إنشاؤها من عينات الدم التي تلتقط الاستجابة المناعية في متلازمات الشريان التاجي الحادة والمزمنة. تتكون مجموعة البيانات من عدة مقايسات بدقة مختلفة ، بما في ذلك بيانات السيتوكين على مستوى العينة ، وبروتينات البلازما ، و العدلات الأولية ، وبيانات RNA-seq أحادية الخلية (scRNA-seq). يضاف المزيد من التعقيد من خلال قياس عدة نقاط زمنية مختلفة لكل مريض والعديد من المجموعات الفرعية للمرضى.
يحدد سير عمل التحليل كيفية دمج البيانات وتحليلها في عدة خطوات: (1) المعالجة المسبقة للبيانات ومواءمتها ، (2) تقدير نموذج MOFA ، (3) التحليل النهائي. توضح الخطوة 1 كيفية معالجة ميزات أنواع البيانات المختلفة ، وتصفية الميزات منخفضة الجودة ، وتطبيعها لتنسيق توزيعاتها لمزيد من التحليل. توضح الخطوة 2 كيفية تطبيق نموذج MOFA واستكشاف مصادر التباين الرئيسية داخل مجموعة البيانات عبر جميع omics والميزات. تقدم الخطوة 3 عدة استراتيجيات لتحليل المصب للأنماط التي تم التقاطها ، وربطها بظروف المرض والعمليات الجزيئية المحتملة التي تحكم تلك الحالات.
بشكل عام ، نقدم سير عمل لاستكشاف البيانات غير الخاضعة للإشراف لمجموعات البيانات المعقدة متعددة الأوميكس لتمكين تحديد محاور الاختلاف الرئيسية المكونة من ميزات جزيئية مختلفة يمكن تطبيقها أيضا على سياقات أخرى ومجموعات بيانات متعددة الأوميكس (بما في ذلك المقايسات الأخرى كما هو موضح في حالة الاستخدام المثالي).
عادة ما تكون آليات المرض معقدة ويحكمها تفاعل العديد من العمليات الجزيئية المتميزة. إن فك رموز الآليات الجزيئية المعقدة التي تؤدي إلى أمراض معينة أو تحكم تطور المرض هي مهمة ذات أهمية طبية عالية لأنها قد تكشف عن رؤى جديدة لفهم الأمراض وعلاجها.
تمكن التطورات التكنولوجية الحديثة من قياس تلك العمليات على دقة أعلى (على سبيل المثال ، على مستوى الخلية الواحدة) وعلى طبقات بيولوجية مختلفة (على سبيل المثال ، الحمض النووي ، mRNA ، إمكانية الوصول إلى الكروماتين ، مثيلة الحمض النووي ، البروتينات) في نفس الوقت. وهذا يؤدي إلى زيادة توليد مجموعات البيانات البيولوجية الكبيرة متعددة الأبعاد ، والتي يمكن تحليلها بشكل مشترك لتوليد المزيد من الأفكار حول العمليات الأساسية. وفي الوقت نفسه، يظل الجمع بين مصادر البيانات المختلفة وتحليلها بطريقة ذات مغزى بيولوجي مهمة صعبة1.
تشكل الحدود التكنولوجية المختلفة والضوضاء ونطاقات التباين بين الأوميكس المختلفة تحديا واحدا. على سبيل المثال ، بيانات تسلسل الحمض النووي الريبي أحادي الخلية (scRNA-seq) متفرقة للغاية وغالبا ما تتأثر بتأثيرات تقنية أو دفعية كبيرة. بالإضافة إلى ذلك ، غالبا ما تكون مساحة الميزة كبيرة جدا ، وتتراوح عبر عدة آلاف من الجينات أو البروتينات المقاسة ، في حين أن أحجام العينات محدودة. ويزداد الأمر تعقيدا بسبب التصاميم المعقدة ، والتي قد تشمل العديد من الحالات المرضية والعوامل المربكة والنقاط الزمنية والقرارات. على سبيل المثال ، في حالة الاستخدام المقدمة ، كانت أنواع البيانات المختلفة متاحة إما على مستوى الخلية الواحدة أو العينة (المجمعة). إلى جانب ذلك ، قد تكون البيانات غير كاملة ، وقد لا تكون جميع القياسات متاحة لجميع الموضوعات التي تم تحليلها.
بسبب هذه التحديات ، لا يزال يتم تحليل omics المختلفة والميزات المضمنة بشكل منفصل فقط2 على الرغم من أن إجراء تحليل متكامل لا يمكن أن يوفر فقط صورة كاملة للعملية ولكن يمكن أيضا تعويض الضوضاء البيولوجية والتقنية من omic واحد بواسطة omics 3,4 أخرى. تم اقتراح عدة طرق مختلفة لإجراء تحليل متكامل للبيانات متعددة الأوميكس ، بما في ذلك طرق بايزي ، والطرق القائمة على الشبكة5،6 ، والتعلم العميق متعدد الوسائط7 ، وطرق تقليل الأبعاد عبر عامل المصفوفة8،9. بالنسبة للأخيرة ، أظهرت نتائج دراسة مرجعية كبيرة10 أن طريقة MOFA9 (تحليل العوامل متعددة الأوميك) هي واحدة من الأدوات الأكثر ملاءمة عندما يجب ربط البيانات بالتعليقات التوضيحية السريرية.
خاصة في البيئات المعقدة ، تعد طرق تحليل عوامل المصفوفة غير الخاضعة للإشراف نهجا مفيدا لتقليل التعقيد واستخراج الإشارات المشتركة والتكميلية من مصادر وميزات البيانات المختلفة. من خلال تحليل الفضاء المعقد إلى تمثيلات كامنة منخفضة الرتبة ، يمكن استكشاف مصادر التباين الرئيسية داخل البيانات بسرعة وربطها بالمتغيرات المشتركة المعروفة. في حالة مشاركة نفس نمط الاختلاف عبر ميزات متعددة (على سبيل المثال ، الجينات أو البروتينات) ، قد يتم تجميع ذلك إلى عوامل قليلة أثناء تقليل الضوضاء. يمكن استخدام التنظيم لزيادة تناثر معاملات النموذج ، مما يجعل النهج مناسبا تماما في الإعدادات التي تكون فيها مساحة المعلم كبيرة بينما يكون عدد العينات محدودا9.
يقدم هذا البروتوكول سير عمل تحليل مرن يستخدم نموذج MOFA لعرض كيفية استكشاف مجموعة بيانات معقدة متعددة الأوميكس بسرعة واستخلاص أنماط الاختلاف الرئيسية التي تميز مجموعة البيانات هذه. يتكون سير العمل من ثلاث خطوات رئيسية. في الخطوة الأولى ، المعالجة المسبقة للبيانات ومواءمتها ، يتم تقديم استراتيجيات مختلفة للمعالجة المسبقة للبيانات بناء على أنواع بيانات الإدخال المختلفة (scRNA-seq ، البروتينات ، السيتوكين ، البيانات السريرية). يوضح البروتوكول كيفية معالجة ميزات مجموعات بيانات الإدخال المختلفة ، وتصفية الميزات منخفضة الجودة ، وتطبيعها لتنسيق توزيعاتها. نوضح أيضا كيف يمكن أن تؤثر قرارات المعالجة المسبقة هذه على النتائج النهائية. في الخطوة الثانية ، يتم تطبيق نموذج MOFA على البيانات ، ويمكن استخدام تحليل التباين الناتج لتقييم تكامل مجموعات البيانات المختلفة. توضح الخطوة الثالثة كيفية ربط العوامل التي تم التقاطها بالمتغيرات المشتركة والكشف عن البرامج الجزيئية التي تحدد تلك العوامل. من خلال سير العمل المقدم ، تمكنا من استخراج العديد من العوامل الكامنة المرتبطة بالمتغيرات السريرية المشتركة في مجموعة بيانات للمرضى الذين يعانون من متلازمات الشريان التاجي وتحديد برامج المناعة متعددة الخلايا الأساسية المحتملة من مشروعسابق 11. سنستخدم مجموعة البيانات هذه هنا ، ولكن يمكن بسهولة تطبيق البروتوكول على سياقات أخرى ، بما في ذلك omics الأخرى.
تتكون مجموعة البيانات من عينات من المرضى الذين يعانون من متلازمات الشريان التاجي المزمنة المستقرة (CCS) ، ومتلازمات الشريان التاجي الحادة (ACS) ، ومجموعة مراقبة مع الشريان التاجي الصحي (غير CCS) (الشكل 1). يحدث ACS بسبب تمزق البلاك في CCS الموجود مسبقا ، مما يؤدي إلى اضطراب حاد في تدفق الدم إلى عضلة القلب وإصابة إقفارية لاحقة للقلب. تسبب هذه الإصابة استجابة التهابية من قبل الجهاز المناعي تليها مرحلة تعويضية ، والتي تستمر حتى عدة أيام بعد الحدث الحاد12. لتكون قادرة على توصيف هذه الاستجابة المناعية لمرضى ACS ، تم أخذ عينات الدم في أربع نقاط زمنية مختلفة: الحادة (TP1). بعد إعادة الاستقناء (14 [± 8] ح) (TP2) ؛ 60 [± 12] ساعة في وقت لاحق (TP3) ؛ قبل التفريغ (6.5 [±1.5] يوما) (TP4) (الشكل 1 أ). بالنسبة ل CCS والمرضى الذين يعانون من الشريان التاجي الصحي ، كانت نقطة زمنية واحدة فقط متاحة- (TP0). لجميع المرضى والنقاط الزمنية تم قياس فحوصات مختلفة بناء على عينات الدم: العلامات السريرية للالتهاب (الكرياتين كيناز (CK) ، CK-MB ، Troponin ، C-reactive protein (CRP)) ، scRNA-seq لخلايا الدم أحادية النواة المحيطية (PBMCs) ، تحليل السيتوكين ، بروتينات البلازما وبيانات prime-seq13 من العدلات.
الشكل 1: مجموعة بيانات الإدخال متعددة الأوميك لاحتشاء عضلة القلب. مجموعة بيانات المدخلات: تتضمن البيانات التي تم تحليلها عينات دم من المرضى (ن = 62) الذين يعانون من متلازمة الشريان التاجي الحادة (ACS) ، ومتلازمات الشريان التاجي المزمنة (CCS) ، والمرضى الذين يعانون من الشريان التاجي الصحي (غير CCS). بالنسبة لمرضى ACS ، تم تضمين عينات الدم في أربع نقاط زمنية مختلفة (TP1-4) ، لمرضى CCS وغير مرضى CCS في نقطة زمنية واحدة (TP0). يتم التعامل مع كل مجموعة من المرضى والنقاط الزمنية كعينة منفصلة في التحليل. تم قياس مقايسات أوميك مختلفة على العينات: اختبارات الدم السريرية (ن = 125) ، scRNA-seq (ن = 121) ، بروتينات البلازما (ن = 119) ، مقايسة السيتوكين (ن = 127) و العدلات الأولية (ن = 121). بعد ذلك ، تم تطبيق البروتوكول الموصوف لدمج البيانات عبر جميع omics واستكشافها باستخدام نموذج MOFA والمزيد من التحليل النهائي (تحليل العوامل ، إثراء المسار). يرجى النقر هنا لعرض نسخة أكبر من هذا الرقم.
كمدخل لسير العمل كما هو موضح هنا ، نأخذ الأعداد الأولية من بيانات scRNA-seq بعد المعالجة باستخدام cellranger ومراقبة الجودة (QC) كما هو موضح ، على سبيل المثال ، في البرنامج التعليمي للمعالجة المسبقة14 الهزيلة. بالنسبة للتعليق التوضيحي من نوع الخلية ، استخدمنا خط أنابيب Azimuth15 الآلي. ثم يتم تجميع الأعداد على مستوى العينة لكل نوع خلية عن طريق أخذ المتوسط عبر جميع الخلايا لكل عينة ونوع الخلية (تجميع شبه مجمع). يتم تضمين البروتينات البلازمية كشدة طبيعية ومتوسطة التركيز ، وبالنسبة للعدلات ، نأخذ عدد إكسون المعرف الجزيئي الفريد UMI (UMI) من التسلسل الأولي. على السيتوكين والقيم السريرية ، لم يتم تطبيق أي معالجة مسبقة سابقة. مزيد من التفاصيل حول توليد البيانات (التجريبية) موضحة في المخطوطة11 المقابلة. نظرا لأن النتائج المقدمة هنا تستند إلى استخدام التعليق التوضيحي الآلي للسمت لأنواع الخلايا في بيانات scRNA-seq مقارنة بالاستراتيجية القائمة على العلامات التي تم استخدامها في المنشور المشار إليه ، فإن النتائج المقدمة هنا متشابهة ولكنها ليست بالضبط نفس النتائج المعروضة في المنشور. في المخطوطة ، يمكن إظهار أن استراتيجية التعليقات التوضيحية من نوع الخلية لا تغير الأنماط الرئيسية والتفسيرات البيولوجية للتحليل ولكن قد تختلف التغييرات الصغيرة في القيم الدقيقة الناتجة عن النموذج. بشكل عام ، كانت بيانات الإدخال عبارة عن مجموعة بيانات معقدة متعددة الأبعاد بما في ذلك نقاط زمنية ومستويات قياس مختلفة (خلايا مفردة مقابل السائبة) لأكثر من 10000 ميزة مختلفة (الجينات والبروتينات والقيم السريرية). وقد تبين أن استراتيجية المعالجة المسبقة الصارمة وتنسيق البيانات التي يتبعها تحليل وزارة الخارجية هي أداة مفيدة وسريعة لاستكشاف البيانات واستخراج برنامج المناعة ذي الصلة. يتم التعامل مع كل نقطة زمنية ومجموعة المرضى كعينة مستقلة في تحليل وزارة الخارجية. يعتبر كل نوع من أنواع البيانات ونوع الخلية وجهة نظر منفصلة في تحليل وزارة الخارجية.
يوفر هذا البروتوكول إرشادات لإعداد بيانات الإدخال لسير العمل ، وتنفيذ خطوات سير العمل المختلفة ، وتخصيص التكوينات ، وتفسير الأرقام الناتجة ، وضبط التكوينات بشكل متكرر بناء على التفسيرات. يتم تقديم نظرة عامة على الخطوات المختلفة للبروتوكول ، ومجموعات بيانات الإدخال المطلوبة في كل خطوة ، والأرقام ومجموعات البيانات الناتجة من خلال نظرة عامة على سير العمل الفني (الشكل 2).
الشكل 2: نظرة عامة على سير العمل الفني. مخطط سير العمل لتحليل مجموعة بيانات متعددة الأوميكس. يتم تمييز العناصر المختلفة بألوان ورموز مختلفة. دفاتر Jupyter التي تنتمي إلى خطوة المعالجة المسبقة للبيانات وتنسيقها (1) ملونة باللون الأزرق. دفاتر Jupyter التي تنتمي إلى خطوة "نموذج MOFA" (2) ملونة باللون البرتقالي. دفاتر Jupyter التي تنتمي إلى خطوة "تحليل المصب" (3) ملونة باللون الأخضر. دفتر ملاحظات Jupyter واحد لاستخدامه لمقارنة النتائج ملون باللون الأصفر. يتم تمييز ملفات التكوين حيث يمكن تعديل معلمات تنفيذ سير العمل باللون الأرجواني. تتم الإشارة إلى مجموعات بيانات الإدخال المطلوبة لتشغيل سير العمل برمز مجموعة البيانات ويتم تمييزها باللون الرمادي. تتم الإشارة إلى جميع مخرجات الشكل التي يتم إنشاؤها أثناء تنفيذ سير العمل بواسطة رمز العدسة المكبرة. تتم الإشارة إلى مجموعات البيانات التي تم إنشاؤها أثناء تنفيذ سير العمل كجداول. بشكل عام ، يتم تنفيذ سير العمل بالتتابع: (1) تتكون المعالجة المسبقة للبيانات وتنسيقها من خطوتين: الجيل الأول من جدول شبه مضخم يعتمد على بيانات إدخال scRNA-seq (01_Prepare_Pseudobulk) والتكامل والتطبيع اللاحق لهذه البيانات مع جميع المدخلات الأخرى على مستوى العينة (المجمعة) (02_Integrate_and_Normalize_Data). ضمن هذه الخطوة عبر ملفات التكوين ، من الممكن تكوين لكل مجموعة بيانات على حدة أي من خطوات المعالجة المسبقة والتطبيع المشار إليها (على سبيل المثال ، مرشح العينة) يجب تطبيقها. (2) "نموذج MOFA": يقوم بتشغيل نموذج MOFA على الإدخال الذي تم إنشاؤه للخطوة الأولى مع التكوينات المحددة في ملف التكوين (03_MOFA_configs.csv) (3) "تحليل المصب": يتكون من ثلاثة دفاتر ملاحظات مختلفة يمكن تشغيلها بشكل مستقل عن بعضها البعض لتوليد رؤى حول نتائج MOFA التي تم إنشاؤها وربطها بعينة البيانات الوصفية (المتغيرات المشتركة) المقدمة كمدخلات عبر ملف "نموذج Data.csv الوصفية". (4) "مقارنة النموذج": هي خطوة صغيرة منفصلة يمكن استخدامها لمقارنة النماذج المختلفة التي تم إنشاؤها في الخطوة 2. يرجى النقر هنا لعرض نسخة أكبر من هذا الرقم.
يتكون سير العمل من عدة دفاتر ملاحظات Jupyter مكتوبة بلغة R و Python (المعرفة بلغة R و Python غير مطلوبة لتشغيل سير العمل ولكنها قد تكون مفيدة في حالة ظهور أخطاء). في خطوات مختلفة من البروتوكول ، يتم تغيير المعلمات عبر ملفات التكوين (ملفات ".csv" التي تحتوي على البادئة اللاحقة "_Configs" في الاسم). ضمن البروتوكول ، نحدد فقط المعلمات التي تحتاج إلى تغيير بدءا من التكوين الافتراضي.
يمكن أيضا تغيير العديد من المعلمات الأخرى ، على سبيل المثال لتخصيص المعالجة المسبقة. يتم تقديم توثيق لهذه المعلمات والتفسيرات في الملف "Documentation_Config_Parameter" ، والذي يتم تضمينه في المستودع الذي تم تنزيله.
1. الاستعدادات: الإعداد الفني والتثبيت
ملاحظة: لتشغيل هذا البرنامج ، قم بتثبيت wget و git و Apptainer مسبقا على الجهاز. يتم إعطاء دليل لتثبيت Apptainer على أنظمة مختلفة (Linux و Windows و Mac) هنا: https://apptainer.org/docs/admin/main/installation.html. يمكن العثور على معلومات التثبيت على git هنا: https://git-scm.com/book/en/v2/Getting-Started-Installing-Git. اعتمادا على حجم مجموعات بيانات الإدخال المختلفة ، يوصى بتشغيل سير العمل على جهاز مناسب (16 وحدة معالجة مركزية ، ذاكرة 64 جيجابايت). يمكن إجراء اختبار دخان مع بيانات المثال المقدمة على الجهاز المحلي. وترد التعليمات والنواتج المتوقعة من تشغيل البروتوكول على بيانات المثال في الملف التكميلي 1. ارجع إلى ملف الفيديو التكميلي 1 لمعرفة الخطوات المهمة للبروتوكول التي يتم تنفيذها على مجموعة البيانات الموضحة أعلاه.
2. التهيئة وإعداد البيانات
الشكل 3: إدخال البيانات وإعدادها. لتنفيذ سير العمل ، يجب تخزين جميع البيانات في مجلد input_data محدد. لكل مجموعة بيانات إدخال يجب توفير ملف منفصل. يجب إعطاء بيانات الخلية الواحدة بتنسيق .h5ad تحتوي على تعليق توضيحي للخلية على cluster_id (ينتج ، على سبيل المثال ، من خطوات التعليق التوضيحي السابقة لنوع الخلية) وعمود sample_id (يحدد بشكل فريد كل عينة منفصلة يجب تحليلها). يجب تقديم جميع مجموعات بيانات المدخلات الأخرى بتنسيق ".csv" ، بما في ذلك عمود واحد يحدد sample_id (المطابقة للعمود المقابل لبيانات الخلية الواحدة) والميزات التي سيتم استخدامها في تحليل وزارة الخارجية في جميع الأعمدة الأخرى. يرجى النقر هنا لعرض نسخة أكبر من هذا الرقم.
الشكل 4: ملفات تكوين مختبر Jupyter. أثناء تنفيذ سير العمل ، يتم تحديد التغييرات في المعلمات (على سبيل المثال ، ضبط خيارات التصفية وما إلى ذلك) عبر ملفات التكوين ".csv". داخل المستودع المستنسخ ، يتم تضمين ملفات التكوين الافتراضية لكل خطوة. يمكن تحريرها مباشرة في وحدة تحكم jupyter-lab ، كما هو الحال في جدول البيانات. يرجى النقر هنا لعرض نسخة أكبر من هذا الرقم.
الشكل 5: نصوص دفاتر Jupyter. يتكون سير العمل الكامل من سلسلة من دفاتر ملاحظات Jupyter التي سيتم تنفيذها بالتتابع بعد تعديل ملفات التكوين المقابلة. بالنقر المزدوج على دفتر Jupyter على الجانب الأيسر ، سيتم فتح الملف المقابل على الجانب الأيمن. يمكن بدء التنفيذ الكامل للملف مع تمييز الزر في الأعلى. يرجى النقر هنا لعرض نسخة أكبر من هذا الرقم.
3. المعالجة المسبقة للبيانات ومواءمتها
الشكل 6: المعالجة المسبقة للبيانات ومواءمتها. أحد مخرجات الخطوة "01_Prepare_Pseudobulk" هو الحبكة "Fig01_Amount_of_Cells_Overview". هنا ، لكل cluster_id (يشير المحور y إلى نوع الخلية من خطوات التعليقات التوضيحية السابقة لنوع الخلية) ، يتم إعطاء عدد الخلايا لكل عينة ('sample_id'). ضمن النتائج المقدمة ، يتم استبعاد أنواع الخلايا التي تحتوي على كمية منخفضة من الخلايا لكل عينة من التحليل اللاحق (المشار إليه بخط يتوسطه خط). يرجى النقر هنا لعرض نسخة أكبر من هذا الرقم.
4. تشغيل وزارة الخارجية
5. تحليل المصب
6. مقارنة التكوينات والإصدارات المختلفة (الشكل التكميلي 1 ، الشكل التكميلي 2 ، الشكل التكميلي 3 ، الشكل التكميلي 4)
7. توسيع سير العمل: إضافة معلمات وتكوينات أخرى
ملاحظة: إلى جانب المعلمات القابلة للتكوين حاليا في ملفات التكوين، قد يتم تضمين تعديلات أخرى في التعليمات البرمجية أو معلمات أخرى. على سبيل المثال ، يقدم نموذج MOFA نفسه العديد من معلمات التدريب الأخرى17 التي يمكن تعديلها مباشرة في الكود أو جعلها قابلة للتعديل عبر ملفات التكوين. سيحدد القسم التالي من البروتوكول مثالا على كيفية القيام بذلك لمعايير التدريب النموذجية الإضافية لوزارة الخارجية. لهذا الجزء ، مطلوب معرفة برمجة R.
بعد التنفيذ الناجح لسير العمل ، يتم إنشاء العديد من الجداول والأشكال كما هو موضح في الشكل 2. يتم وضع الأشكال في مجلد / الأشكال (الشكل 6 ، الشكل 7 ، الشكل 8 ، الشكل التكميلي 1 ، الشكل التكم?...
باستخدام البروتوكول المحدد ، يتم تقديم سير عمل معياري وقابل للتمديد قائم على دفتر ملاحظات Jupyter يمكن استخدامه لاستكشاف مجموعة بيانات معقدة متعددة الأوميكس بسرعة. تتكون الأجزاء الرئيسية من تدفق العمل من جزء المعالجة المسبقة وتنسيق البيانات (تقديم خطوات قياسية مختلفة لتص...
يعلن أصحاب البلاغ عدم وجود تضارب في المصالح.
يتم دعم C.L. من قبل جمعية هيلمهولتز في إطار مدرسة الأبحاث المشتركة "مدرسة ميونيخ لعلوم البيانات - MUDS".
Name | Company | Catalog Number | Comments |
Apptainer | NA | NA | https://apptainer.org/docs/admin/main/installation.html |
Compute server or workstation or cloud (Linux, Mac or Windows environment). Depending on the size of the different input datasets we recommend running the workflow on a suitable machine (in our setting we use: 16 CPU, 64GB Memory) | Any manufacturer | 16 CPU, 64GB Memory | Large Memory is only required for the processing of the raw single cell data. After preprocessing the later analysis steps can also be performed on regular desktop or laptop computers |
git | NA | NA | https://git-scm.com/book/en/v2/Getting-Started-Installing-Git |
GitHub | GitHub | NA | https://github.com/heiniglab/mofa_workflow |
Request permission to reuse the text or figures of this JoVE article
Request PermissionThis article has been published
Video Coming Soon
Copyright © 2025 MyJoVE Corporation. All rights reserved