Abstract
Biochemistry
बायोमेडिकल रिपोर्ट की तेजी से बढ़ती और विशाल मात्रा, प्रत्येक में कई संस्थाएं और समृद्ध जानकारी होती है, बायोमेडिकल टेक्स्ट-माइनिंग अनुप्रयोगों के लिए एक समृद्ध संसाधन का प्रतिनिधित्व करती है। ये उपकरण जांचकर्ताओं को रोग विकृति और चिकित्सीय में नई अंतर्दृष्टि को उजागर करने के लिए इन खोजों को एकीकृत, अवधारणा और अनुवाद करने में सक्षम बनाते हैं। इस प्रोटोकॉल में, हम टेक्स्ट डेटासेट (जैसे, बायोमेडिकल साहित्य) से उपयोगकर्ता-चयनित जानकारी निकालकर सेलुलर घटकों और उनके रोग संघों की जांच करने के लिए एक नई कम्प्यूटेशनल पाइपलाइन, केसओलैप लिफ्ट प्रस्तुत करते हैं। सॉफ्टवेयर रोग-प्रासंगिक दस्तावेजों के भीतर उप-सेलुलर प्रोटीन और उनके कार्यात्मक भागीदारों की पहचान करता है। सॉफ्टवेयर के लेबल लांछन विधि के माध्यम से अतिरिक्त रोग-प्रासंगिक दस्तावेजों की पहचान की जाती है। परिणामी प्रोटीन-रोग संघों को प्रासंगिक बनाने और कई प्रासंगिक बायोमेडिकल संसाधनों से जानकारी को एकीकृत करने के लिए, आगे के विश्लेषण के लिए स्वचालित रूप से एक ज्ञान ग्राफ का निर्माण किया जाता है। हम इस पद्धति का उपयोग करके अलग-अलग कार्डियोवैस्कुलर रोग फेनोटाइप्स में माइटोकॉन्ड्रियल प्रोटीन की भूमिका को स्पष्ट करने का एक उदाहरण प्रदान करने के लिए ऑनलाइन डाउनलोड किए गए ~ 34 मिलियन पाठ दस्तावेजों के संग्रह के साथ एक उपयोग मामला प्रस्तुत करते हैं। इसके अलावा, प्रोटीन और बीमारी के बीच पहले से रिपोर्ट नहीं किए गए संबंधों की भविष्यवाणी करने के लिए परिणामी ज्ञान ग्राफ पर एक गहन शिक्षण मॉडल लागू किया गया था, जिसके परिणामस्वरूप अनुमानित संभावनाओं >0.90 और परीक्षण सेट पर 0.91 के रिसीवर ऑपरेटिंग विशेषता वक्र (एयूआरओसी) के तहत एक क्षेत्र के साथ 1,583 संबंध थे। इस सॉफ्टवेयर में विश्लेषण के लिए उपलब्ध कच्चे डेटा के व्यापक दायरे के साथ एक अत्यधिक अनुकूलन योग्य और स्वचालित वर्कफ़्लो है; इसलिए, इस पद्धति का उपयोग करके, प्रोटीन-रोग संघों को एक टेक्स्ट कॉर्पस के भीतर बढ़ी हुई विश्वसनीयता के साथ पहचाना जा सकता है।
Explore More Videos
ABOUT JoVE
Copyright © 2024 MyJoVE Corporation. All rights reserved