यह कम्प्यूटेशनल प्रोटोकॉल महत्वपूर्ण है क्योंकि यह सेलुलर घटकों के बीच संबंधों की जांच करने की अनुमति देता है, उदाहरण के लिए, माइटोकॉन्ड्रिया प्रोटीन और बीमारी के साथ उनके संबंध, जैसा कि बायोमेडिकल प्रकाशनों में बताया गया है। केसओलैप लिफ्ट जांचकर्ताओं को बायोमेडिकल रिपोर्ट और ज्ञान के आधार से जानकारी निकालने और एकीकृत करने का अधिकार देता है। एक ज्ञान ग्राफ के रूप में संगठित, इन परिणामों का लाभ नए रिश्तों की भविष्यवाणी करने के लिए उठाया जा सकता है।
ये शोध निष्कर्ष पहचाने गए और अनुमानित प्रोटीन रोग संघों की प्राथमिकता सूची को उजागर करके परिकल्पना पीढ़ी का समर्थन करते हैं, जो रोग विकृति और चिकित्सीय में नई अंतर्दृष्टि को उजागर करने के लिए उपयोगी है। इस अत्यधिक अनुकूलन योग्य वर्कफ़्लो को किसी भी प्रकाशन तिथि सीमा के भीतर उनके एमईएसएच शब्द के माध्यम से बीमारियों की किसी भी सूची में उनके जीओ शब्द के माध्यम से किसी भी सेलुलर घटक पर लागू किया जा सकता है। यह उपयोगकर्ता के अनुकूल प्रोटोकॉल विश्लेषण के लिए आवश्यक कम्प्यूटेशनल विशेषज्ञता को कम करता है।
सॉफ्टवेयर को डॉकर कंटेनर के रूप में जारी किया जाता है, जिसे निष्पादित करने के लिए केवल पर्याप्त कम्प्यूटेशनल स्टोरेज और संसाधनों की आवश्यकता होती है। CaseOLAP लिफ्ट डॉकर कंटेनर डाउनलोड करने के लिए टर्मिनल विंडो खोलें, और नवीनतम CaseOLAP_LIFT डॉकर पुल CaseOLAP स्लैश टाइप करें। एक निर्देशिका बनाएं जो सभी प्रोग्राम डेटा और आउटपुट को संग्रहीत करेगी।
डॉकर कंटेनर को स्क्रीन पर दिखाए गए कमांड के साथ प्रारंभ करें, PATH_TO_FOLDER फ़ोल्डर के लिए पूर्ण फ़ाइल पथ के रूप में प्रतिस्थापित करें। कंटेनर के भीतर इलास्टिक सर्च शुरू करने के लिए, एक नई टर्मिनल विंडो खोलें और स्क्रीन पर दिखाए गए कमांड टाइप करें। CaseOLAP_LIFT फ़ोल्डर पर नेविगेट करें।
सुनिश्चित करें कि डाउनलोड लिंक और कॉन्फ़िगरेशन स्लैश knowledge_base_links। JSON प्रत्येक नॉलेज बेस संसाधन के नवीनतम संस्करण के लिए अद्यतित और सटीक हैं। जीन ऑन्कोलॉजी या जीओ शब्द निर्धारित करने के लिए, वेबसाइट जीनोंटोलॉजी पर जाएं।
संगठन, और सभी जीओ शर्तों के लिए पहचानकर्ताओं का पता लगाएं। इसी तरह, स्क्रीन पर दिखाई गई वेबसाइट से मेडिकल सब्जेक्ट हेडर या एमईएसएच पहचानकर्ताओं के माध्यम से रोग श्रेणियों का पता लगाएं। प्री-प्रोसेसिंग मॉड्यूल को निष्पादित करने के लिए, डैश सी ध्वज का उपयोग करके उपयोगकर्ता-परिभाषित अध्ययन किए गए जीओ शब्दों को इंगित करें, डैश डी ध्वज का उपयोग करके रोग एमईएसएच ट्री नंबर, और डैश ए ध्वज के साथ संक्षिप्तीकरण निर्दिष्ट करें।
पाठ खनन मॉड्यूल निष्पादित करने के लिए, पायथन, स्थान, CaseOLAP_LIFT टाइप करें। अवर्गीकृत दस्तावेज़ों के विषयों को आरोपित करने के लिए डैश एल फ्लैग को पाय, स्पेस, text_mining और डैश टी फ्लैग को रोग से संबंधित दस्तावेजों के पूर्ण पाठ को डाउनलोड करने के लिए जोड़ें। सुनिश्चित करें कि पाठ माइनिंग परिणाम परिणाम फ़ोल्डर में हैं।
विश्लेषण के लिए उपयोग किए जाने वाले पाठ खनन परिणामों को इंगित करके या तो सभी कार्यात्मक रूप से संबंधित प्रोटीनों को शामिल करने के लिए सभी प्रोटीनों का विश्लेषण करें, या केवल जीओ शब्द से संबंधित प्रोटीन को शामिल करने के लिए कोर प्रोटीन का विश्लेषण करें। प्रत्येक बीमारी के लिए शीर्ष प्रोटीन और मार्गों की पहचान करने के लिए, केसओएलएपी स्कोर प्रत्येक रोग श्रेणी के भीतर जेड-स्कोर रूपांतरित होते हैं। एक निर्दिष्ट थ्रेशोल्ड स्कोर को इंगित करने के लिए डैश जेड ध्वज निर्दिष्ट करें जिसके ऊपर प्रोटीन को महत्वपूर्ण माना जाएगा।
विश्लेषण परिणामों की समीक्षा करें और आवश्यकतानुसार समायोजित करें। फ़ाइल z_score_cutoff_table खोलें. उत्पन्न जेड-स्कोर तालिका को देखने के लिए सीएसवी जिसमें प्रत्येक रोग श्रेणी के लिए महत्वपूर्ण प्रोटीन की संख्या होती है।
यह उपयोगकर्ता को एक उपयुक्त जेड-स्कोर सीमा का चयन करने के लिए सूचित करने में मदद करता है। परिणाम फ़ोल्डर खोलें और सुनिश्चित करें कि पूर्व-प्रसंस्करण से उत्पन्न फ़ोल्डर सहित आवश्यक फ़ाइलें फ़ोल्डर में हैं। कोर प्रोटीन फ़ोल्डरों में सभी प्रोटीनों की जाँच करें।
ज्ञान ग्राफ को डिजाइन करने के लिए, एमईएसएच ध्वज को शामिल करने के साथ एमईएसएच रोग पेड़ शामिल करें। स्ट्रिंग के साथ प्रोटीन-प्रोटीन इंटरैक्शन में पीपीआई फ्लैग, साझा प्रतिक्रिया मार्ग के साथ पीडब्ल्यू फ्लैग शामिल हैं, और जीआरएनडीबी जीटीईएक्स से ट्रांसक्रिप्शन फैक्टर निर्भरता में टीएफडी ध्वज शामिल है। केवल जीओ शब्द से संबंधित प्रोटीन को शामिल करने के लिए कोर प्रोटीन का विश्लेषण करके ज्ञान ग्राफ निर्माण मॉड्यूल चलाएं।
एज वेट को स्केल करने के लिए, डिफ़ॉल्ट केसओएलएपी स्कोर के बजाय गैर-नकारात्मक जेड-स्कोर के लिए स्केल जेड-स्कोर का उपयोग करें। आउटपुट की जाँच करें और सुनिश्चित करें कि ज्ञान ग्राफ़ फ़ाइलें merged_edges हैं। टीएसवी और merged_nodes।
टीएसवी फ़ाइलें मौजूद हैं। अंत में, प्रोटीन रोग संघों की भविष्यवाणी के लिए ज्ञान ग्राफ ़ भविष्यवाणी स्क्रिप्ट चलाने के लिए स्क्रीन पर दिखाए गए कमांड को टाइप करें। यह आंकड़ा माइटोकॉन्ड्रियल प्रोटीन को प्रत्येक रोग श्रेणी के लिए महत्वपूर्ण प्रस्तुत करता है।
जेड-स्कोर परिवर्तन को प्रत्येक श्रेणी के भीतर केसओएलएपी स्कोर पर लागू किया गया था ताकि तीन की सीमा का उपयोग करके महत्वपूर्ण प्रोटीन की पहचान की जा सके। प्रत्येक रोग श्रेणी के लिए महत्वपूर्ण प्रोटीन की कुल संख्या प्रत्येक वायलिन प्लॉट के ऊपर दिखाई गई है। इन प्रोटीनों के रिएक्टोम मार्ग विश्लेषण ने सभी बीमारियों के लिए महत्वपूर्ण 12 मार्गों का खुलासा किया।
रोग विशिष्ट ज्ञान ग्राफ पर गहरी शिक्षा लागू करने का एक उदाहरण इस आंकड़े में प्रस्तुत किया गया है। प्रोटीन और बीमारी के बीच छिपे हुए संबंधों की भविष्यवाणी की जाती है, और दोनों भविष्यवाणियों के लिए गणना की गई संभावनाओं को शून्य से एक तक के मूल्यों के साथ यहां प्रदर्शित किया जाता है, जहां एक मजबूत भविष्यवाणी इंगित करता है। निर्दिष्ट अनुक्रम इस प्रोटोकॉल के निष्पादन के लिए महत्वपूर्ण है, विशेष रूप से पूर्व-प्रसंस्करण और पाठ खनन मॉड्यूल।
ये दो कदम सीधे प्रत्येक बीमारी के लिए शीर्ष प्रोटीन और मार्गों की पहचान को प्रभावित करते हैं, साथ ही रोग विशिष्ट ज्ञान ग्राफ के लिए निर्माण भी करते हैं। परिणामी ज्ञान ग्राफ को प्रभावी ढंग से ग्राफ टूल द्वारा देखा जाता है, जैसे कि नियो4जे और साइटोस्केप, और नए रिश्तों की उन्नत गहरी सीखने की भविष्यवाणियों के लिए इसका लाभ उठाया जा सकता है। CaseOLAP लिफ्ट किसी भी सेलुलर घटक और रोग श्रेणियों के बीच संबंधों के अध्ययन को सक्षम बनाता है।
परिणामी ज्ञान ग्राफ और रैंक प्रोटीन रोग संघ प्राकृतिक भाषा प्रसंस्करण और अनुवर्ती ग्राफ-आधारित विश्लेषण का समर्थन करते हैं।