Abstract
Biochemistry
הכמויות הגדלות במהירות והכמויות העצומות של דוחות ביו-רפואיים, שכל אחד מהם מכיל ישויות רבות ומידע עשיר, מייצגים משאב עשיר ליישומי כריית טקסט ביו-רפואיים. כלים אלה מאפשרים לחוקרים לשלב, להמשיג ולתרגם תגליות אלה כדי לחשוף תובנות חדשות על פתולוגיה וטיפולים של מחלות. בפרוטוקול זה, אנו מציגים את CaseOLAP LIFT, צינור חישובי חדש לחקר רכיבים תאיים והקשרים שלהם למחלות על ידי חילוץ מידע שנבחר על ידי המשתמש ממערכי נתונים טקסטואליים (למשל, ספרות ביו-רפואית). התוכנה מזהה חלבונים תת-תאיים ואת שותפיהם הפונקציונליים בתוך מסמכים רלוונטיים למחלות. מסמכים נוספים הרלוונטיים למחלה מזוהים באמצעות שיטת זקיפת התוויות של התוכנה. כדי לקשר את הקשרים בין מחלות חלבון הנובעות מכך ולשלב מידע ממשאבים ביו-רפואיים רלוונטיים מרובים, גרף ידע נבנה באופן אוטומטי לניתוחים נוספים. אנו מציגים מקרה שימוש אחד עם קורפוס של ~ 34 מיליון מסמכי טקסט שהורדו באינטרנט כדי לספק דוגמה להבהרת תפקידם של חלבונים מיטוכונדריאליים בפנוטיפים שונים של מחלות לב וכלי דם באמצעות שיטה זו. יתר על כן, מודל למידה עמוקה יושם על גרף הידע שהתקבל כדי לחזות קשרים שלא דווחו בעבר בין חלבונים למחלות, וכתוצאה מכך 1,583 קשרים עם הסתברויות חזויות >0.90 ועם שטח מתחת לעקומת ההפעלה של המקלט (AUROC) של 0.91 בקבוצת הבדיקה. תוכנה זו כוללת זרימת עבודה אוטומטית וניתנת להתאמה אישית, עם היקף רחב של נתונים גולמיים הזמינים לניתוח; לכן, באמצעות שיטה זו, ניתן לזהות אסוציאציות של מחלות חלבונים עם אמינות משופרת בתוך קורפוס טקסט.
Explore More Videos
ABOUT JoVE
Copyright © 2024 MyJoVE Corporation. All rights reserved