Abstract
Biochemistry
وتمثل الكميات المتزايدة بسرعة والهائلة من التقارير الطبية الحيوية، التي يحتوي كل منها على العديد من الكيانات والمعلومات الغنية، موردا غنيا لتطبيقات التنقيب عن النصوص الطبية الحيوية. تمكن هذه الأدوات الباحثين من دمج هذه الاكتشافات وتصورها وترجمتها للكشف عن رؤى جديدة في علم أمراض الأمراض والعلاجات. في هذا البروتوكول ، نقدم CaseOLAP LIFT ، وهو خط أنابيب حسابي جديد للتحقيق في المكونات الخلوية وارتباطاتها المرضية عن طريق استخراج المعلومات التي يختارها المستخدم من مجموعات البيانات النصية (على سبيل المثال ، الأدبيات الطبية الحيوية). يحدد البرنامج البروتينات دون الخلوية وشركائها الوظيفيين ضمن المستندات ذات الصلة بالمرض. يتم تحديد المستندات الإضافية ذات الصلة بالمرض عبر طريقة احتساب ملصق البرنامج. لوضع سياق الارتباطات الناتجة عن أمراض البروتين ودمج المعلومات من العديد من الموارد الطبية الحيوية ذات الصلة ، يتم إنشاء رسم بياني معرفي تلقائيا لمزيد من التحليلات. نقدم حالة استخدام واحدة مع مجموعة من ~ 34 مليون وثيقة نصية تم تنزيلها عبر الإنترنت لتقديم مثال على توضيح دور بروتينات الميتوكوندريا في الأنماط الظاهرية المتميزة لأمراض القلب والأوعية الدموية باستخدام هذه الطريقة. علاوة على ذلك ، تم تطبيق نموذج التعلم العميق على الرسم البياني المعرفي الناتج للتنبؤ بالعلاقات غير المبلغ عنها سابقا بين البروتينات والمرض ، مما أدى إلى 1,583 ارتباطا مع الاحتمالات المتوقعة >0.90 ومع منطقة تحت منحنى خصائص تشغيل المستقبل (AUROC) تبلغ 0.91 في مجموعة الاختبار. يتميز هذا البرنامج بسير عمل آلي وقابل للتخصيص بدرجة عالية ، مع نطاق واسع من البيانات الخام المتاحة للتحليل ؛ لذلك ، باستخدام هذه الطريقة ، يمكن تحديد ارتباطات أمراض البروتين بموثوقية معززة داخل مجموعة نصية.
Explore More Videos
ABOUT JoVE
Copyright © 2024 MyJoVE Corporation. All rights reserved