A subscription to JoVE is required to view this content. Sign in or start your free trial.
نقدم CorrelationCalculator و Filigree ، وهما أداتان لبناء شبكة تعتمد على البيانات وتحليل بيانات الأيض. يدعم CorrelationCalculator بناء شبكة تفاعل واحدة من المستقلبات بناء على بيانات التعبير ، بينما يسمح Filigree ببناء شبكة تفاضلية ، تليها تجميع الشبكة وتحليل الإثراء.
يتمثل أحد التحديات الكبيرة في تحليل بيانات omics في استخراج المعرفة البيولوجية القابلة للتنفيذ. الأيض ليست استثناء. تتفاقم المشكلة العامة المتمثلة في ربط التغيرات في مستويات المستقلبات الفردية بعمليات بيولوجية محددة بسبب العدد الكبير من المستقلبات غير المعروفة الموجودة في دراسات قياس الطيف الكتلي للكروماتوغرافيا السائلة غير المستهدفة (LC-MS). علاوة على ذلك ، يتم تمثيل التمثيل الغذائي الثانوي واستقلاب الدهون بشكل ضعيف في قواعد بيانات المسار الحالية. للتغلب على هذه القيود ، طورت مجموعتنا العديد من الأدوات لبناء وتحليل الشبكة القائمة على البيانات. وتشمل هذه حاسبة الارتباط و Filigree. تسمح كلتا الأداتين للمستخدمين ببناء شبكات قائمة على الارتباط الجزئي من بيانات الأيض التجريبية عندما يتجاوز عدد المستقلبات عدد العينات. يدعم CorrelationCalculator بناء شبكة واحدة ، بينما يسمح Filigree ببناء شبكة تفاضلية باستخدام البيانات من مجموعتين من العينات ، يليها تجميع الشبكة وتحليل الإثراء. سنصف فائدة وتطبيق كلتا الأداتين لتحليل بيانات الأيض الواقعية.
في العقد الماضي ، برز الأيض كعلم أوميكس بسبب التقدم في التقنيات التحليلية مثل كروماتوغرافيا الغاز - قياس الطيف الكتلي (GC-MS) وكروماتوغرافيا السائل - قياس الطيف الكتلي (LC-MS). تسمح هذه التقنيات بالقياس المتزامن لمئات إلى آلاف مستقلبات الجزيئات الصغيرة ، مما يؤدي إلى إنشاء مجموعات بيانات معقدة متعددة الأبعاد. يمكن إجراء تجارب الأيض في أوضاع مستهدفة أو غير مستهدفة. تقيس تجارب الأيض المستهدفة فئات معينة من الأيضات. وعادة ما تكون مدفوعة بالفرضيات، في حين أن النهج غير المستهدفة تحاول قياس أكبر عدد ممكن من المستقلبات وتولد الفرضيات بطبيعتها. عادة ما تتضمن المقايسات المستهدفة معايير داخلية وبالتالي تسمح بالتحديد الكمي المطلق للمستقلبات ذات الأهمية. في المقابل ، تسمح المقايسات غير المستهدفة بالقياس الكمي النسبي وتشمل العديد من المستقلبات غير المعروفة1.
تحليل بيانات الأيض هو عملية متعددة الخطوات تستفيد من العديد من أدوات البرامج المتخصصة1. يمكن تقسيمها إلى الخطوات الرئيسية الثلاث التالية: (1) معالجة البيانات ومراقبة الجودة ، (2) التحليل الإحصائي ، و (3) تفسير البيانات البيولوجية. تم تصميم الأدوات الموضحة هنا لتمكين الخطوة الأخيرة من التحليل.
تتمثل إحدى الطرق البديهية والشائعة لتفسير بيانات الأيض في تعيين القياسات التجريبية على المسارات الأيضية. تم تصميم العديد من الأدوات لتحقيق ذلك2،3،4،5 ، بما في ذلك Metscape ، التي طورتها مجموعتنا6. غالبا ما يتم الجمع بين رسم خرائط المسار وتحليل الإثراء ، مما يساعد على تحديد أهم المسارات 7,8. اكتسبت هذه التقنيات أهمية لأول مرة في تحليل بيانات التعبير الجيني وتم تطبيقها بنجاح لتحليل بيانات البروتينات وعلم ما فوق الجينوم9،10،11،12،13. ومع ذلك ، فإن تحليل بيانات الأيض يمثل عددا من التحديات للنهج القائمة على المعرفة. أولا ، بالإضافة إلى المستقلبات الداخلية ، تقيس مقايسات الأيض المركبات الخارجية ، بما في ذلك تلك التي تأتي من التغذية والمصادر البيئية الأخرى. لا يمكن تعيين هذه المركبات ، وكذلك المستقلبات التي تنتجها البكتيريا ، على المسارات البشرية أو الأيضية للكائنات حقيقية النواة الأخرى. علاوة على ذلك ، لا تسمح تغطية المسار لعملية التمثيل الغذائي الثانوي واستقلاب الدهون حاليا برسم خرائط عالية الدقة على المستوى الذي من شأنه أن يدعم بسهولة التفسير البيولوجي للبيانات14,15.
يمكن أن تساعد تقنيات تحليل الشبكة القائمة على البيانات في التغلب على هذه التحديات. على سبيل المثال ، يمكن أن تساعد الشبكات القائمة على الارتباط في اشتقاق العلاقات بين كل من المستقلبات المعروفة وغير المعروفة وتسهيل شرح المجهول16. في حين أن حساب معاملات ارتباط بيرسون هو النهج الأكثر مباشرة لإنشاء العلاقات الخطية بين المستقلبات ، فإن العيب هو أنه يلتقط كل من الارتباطات المباشرة وغير المباشرة17،18،19. البديل هو حساب معاملات الارتباط الجزئي التي يمكن أن تميز بين الارتباطات المباشرة وغير المباشرة. يمكن استخدام النمذجة الرسومية الغاوسية (GGM) لتقدير شبكات الارتباط الجزئي. ومع ذلك ، يتطلب GGM أن يكون حجم العينة وعدد الميزات قابلين للمقارنة. نادرا ما يتم استيفاء هذا الشرط في بيانات LC-MS غير المستهدفة التي تحتوي على قياسات لآلاف الميزات الأيضية. يمكن استخدام تقنيات التنظيم للتغلب على هذا القيد. يعد لاسو الرسومي (Glasso) والانحدار العقدي من الطرق الشائعة للتقدير المنظم لشبكة الارتباط الجزئي16,20.
تعتمد أول أدوات المعلوماتية الحيوية المعروضة هنا ، CorrelationCalculator16 ، على خوارزمية الارتباط الجزئي المتناثر غير المتحيز (DSPC). يعتمد DSPC على نمذجة لاسو رسومية غير متفرقة. الافتراض الأساسي للخوارزمية هو أن عدد الاتصالات بين المستقلبات أصغر بكثير من عدد العينات ، أي أن شبكة الارتباط الجزئي للمستقلبات قليلة. يسمح هذا الافتراض ل DSPC باكتشاف الاتصال بين أعداد كبيرة من المستقلبات باستخدام عينات أقل ، والاستفادة من تقنيات الانحدار المنظم. علاوة على ذلك ، باستخدام خطوة عدم التحيز لتقديرات الانحدار المنظمة ، فإنه يحصل على توزيعات أخذ العينات لمعلمات الحافة التي يمكن استخدامها لبناء فترات الثقة واختبار فرضيات الاهتمام (على سبيل المثال ، وجود / عدم وجود واحد أو مجموعة من الحواف). وبالتالي يمكن اختبار وجود أو عدم وجود حافة في شبكة الارتباط الجزئي رسميا باستخدام قيم p المحسوبة.
أثبتت CorrelationCalculator أنها مفيدة جدا لتحليل المجموعةالواحدة 16 ؛ ومع ذلك ، فإن الهدف من العديد من تجارب الأيض هو التحليل التفاضلي لشرطين أو أكثر. بينما يمكن استخدام CorrelationCalculator على كل مجموعة على حدة لإنشاء شبكات ارتباط جزئية لكل حالة ، فإن هذا النهج يحد من عدد العينات التي يمكن استخدامها لتوليد الشبكة. نظرا لأن حجم العينة الكبير بما فيه الكفاية هو أحد أكبر الاعتبارات في التحليل المستند إلى البيانات ، فإن الطرق التي يمكنها الاستفادة من جميع العينات المتاحة في البيانات لبناء الشبكات مرغوبة للغاية. يتم تنفيذ هذا النهج في الأداة الثانية المعروضة هنا ، والتي تسمى Filigree21. يعتمد Filigree على خوارزمية تحليل إثراء الشبكة التفاضلية (DNEA) المنشورة سابقا22. يوضح الجدول 1 التطبيقات وسير العمل لكلتا الأداتين.
عدد الظروف التجريبية (ك) | ك = 1 | ك = 2 |
أداة برمجية | الارتباطحاسبة | الصغر |
إدخال البيانات | • المستقلبات × مصفوفة بيانات العينات | • المستقلبات × مصفوفة بيانات العينات • المجموعات التجريبية |
سير العمل •المعالجه المسبقه • تقدير الشبكة • تجميع الشبكات • تحليل الإثراء | • تحويل السجل. التحجيم التلقائي • DSPC • عبر التطبيقات الخارجية •لا | • تحويل السجل. التحجيم التلقائي • تقدير الشبكة المشتركة • تجميع توافق الآراء • نت جي إس إيه |
تصور البيانات | عبر تطبيق خارجي ، على سبيل المثال ، Cytoscape | عبر تطبيق خارجي ، على سبيل المثال ، Cytoscape |
اختبار وحدات التمثيل الغذائي للارتباط مع نتائج الاهتمام (اختياري) | عبر التطبيقات الخارجية | عبر التطبيقات الخارجية |
الجدول 1: نطاق التطبيق وسير عمل CorrelationCalculator و Filigree.
1. حاسبة الارتباط
2. الفيليغري
3. اعتبارات إضافية
لتوضيح استخدام CorrelationCalculator ، قمنا ببناء شبكة ارتباط جزئي باستخدام مجموعة فرعية من بيانات الأيض من دراسة سكان KORA الموصوفة في Krumsiek et al.24. احتوت مجموعة البيانات على 151 مستقلبا و 240 عينة. يوضح الشكل 1 شبكة الارتباط الجزئي الناتجة التي تم تصورها في Cytoscape. تحتوي ال...
تساعد طرق تحليل الشبكة القائمة على الارتباط الجزئي المطبقة في CorrelationCalculator و Filigree في التغلب على بعض قيود تحليلات المسار الأيضي القائمة على المعرفة ، خاصة بالنسبة لمجموعات البيانات ذات الانتشار المرتفع للمستقلبات غير المعروفة والتغطية المحدودة للمسارات الأيضية (على سبيل المثال ، بيانات ا...
وليس للمؤلفين مصالح مالية متنافسة.
تم دعم هذا العمل من خلال منحة NIH 1U01CA235487.
Name | Company | Catalog Number | Comments |
CorrelationCalculator | JAVA | http://metscape.med.umich.edu/calculator.html | |
clusterNet | https://github.com/Karnovsky-Lab/clusterNet | ||
Cytoscape | Cytoscape | https://cytoscape.org/ | |
Filigree | JAVA | http://metscape.med.umich.edu/filigree.html | |
MetScape | Cytoscape | https://apps.cytoscape.org/apps/metscape | Cytoscape application that allows for the creation and exploration of correlation networks. |
Request permission to reuse the text or figures of this JoVE article
Request PermissionExplore More Articles
This article has been published
Video Coming Soon
Copyright © 2025 MyJoVE Corporation. All rights reserved