המחקר שלנו מתמקד באיתור וכימות של חלבונים מיקרוביאליים והבנת תפקידם במחלות קליניות. תחום מחקר זה נקרא מטה-פרוטאומיקה קלינית. במחקר זה, פיתחנו זרימת עבודה ביואינפורמטית שתאפשר לחוקרים להבין כיצד פעילות חיידקים יכולה להשפיע על התקדמות המחלה.
ניתוח מטה-פרוטאומי של דגימות קליניות מציב אתגרים רבים, כולל טיפול במאגרי רצפי חלבונים גדולים מאוד לזיהוי פפטידים וחלבונים מיקרוביאליים רגישים ומדויקים מנתוני ספקטרומטריית מסה, בנוסף לביצוע הערות טקסונומיות ופונקציונליות של פפטידים וחלבונים כמותיים כדי לאפשר פירוש ביולוגי של התוצאות. זרימת העבודה מציעה יתרונות מרובים, כולל הפחתת מסד נתונים באמצעות זרימת העבודה שלנו להפחתת מסד הנתונים, היכולת לחפש פפטידים מיקרוביאליים באמצעות אלגוריתמי חיפוש מרובים, היכולת לאמת פפטידים מיקרוביאליים שזוהו בנתוני ספקטרומטריית המסה, היכולת לכמת את החלבונים המיקרוביאליים יחד עם החלבונים המארחים, והפרשנות הביולוגית של הנתונים באמצעות ניתוח סטטיסטי וחזותי. השתמשנו בזרימת העבודה המטא-פרוטאומיקה הקלינית כדי לזהות פאנל פפטידים מיקרוביאלי למחקרי התקדמות מחלת סיסטיק פיברוזיס כדי לחקור את מצב ההדבקה המשותפת במהלך גלי מגיפת COVID-19.
מחקרים אלה פורסמו בכתבי עת אקדמיים שעברו ביקורת עמיתים. אנו משתמשים כעת בזרימת עבודה זו למחקר מתמשך לפיתוח פאנל פפטיד מטרה מנבא לסרטן השחלות. צוות Galaxy P מעורב במחקר מולטיומיקה, ואנו מפתחים מספר תהליכי עבודה מתקדמים לניתוח פרוטאוגנומיקה ומטא-פרוטאומיקה.
בימים אלה אנו עובדים גם על פיתוח תהליכי עבודה לאימונופפטידומיקה, שיאפשרו לחוקרים לזהות ולאפיין פפטידים המוצגים למערכת החיסון, חלקם במהלך התקדמות הסרטן הנקראים ניאו-אנטיגנים, וגם במחלות אחרות שבהן אלה עשויים להיות גם פפטידים מיקרוביאליים. כדי להתחיל, קבל רשימה של מינים הקשורים למחלה או למצב המעניין. השתמש בקובץ רשימת המינים שכותרתו מינים.
tabular"כקלט עבור UniProt. הורד את הפרוטאום בפורמט FASTA כדי ליצור מסד נתונים של רצף חלבונים. הפעל את הורדת מסד הנתונים של החלבונים כדי ליצור שני מסדי נתונים נוספים של רצפי חלבונים, מסד נתונים אנושי של Swiss-Prot המכיל רק ערכים שנבדקו ומסד נתונים של חלבונים מזהמים המכיל מאגר משותף של חלבונים הרפתקניים, או cRAP.
השתמש בשלושת מסדי הנתונים של החלבונים כקלט עבור קבצי מיזוג FASTA וסנן רצפים ייחודיים כדי לא לכלול כפילויות. באמצעות מערך הנתונים הגדול שנוצר במסד הנתונים וספקטרומטריית המסה כקלט, הפעל את MetaNovo כדי ליצור מסד נתונים מופחת של רצף חלבונים, ולאחר מכן הפעל קבצי מיזוג FASTA וסנן רצפים ייחודיים במסד הנתונים שנוצר על ידי MetaNovo, מסדי נתונים אנושיים של Swiss-Prot ו-cRAP כדי ליצור מסד נתונים יעד מופחת המכיל רצפי חלבונים מיקרוביאליים, אנושיים ומזהמים לזיהוי פפטידים. הפעל ממשק משתמש גרפי לחיפוש "כדי ליצור קובץ ארכיון המכיל התאמות ספקטרום פפטידים, או PSM.
השתמש בממשק המשתמש הגרפי של החיפוש כקלט עבור פפטיד-שייקר "כדי ליצור את דוחות ה-PSM, הפפטיד והחלבון. הפעל את MaxQuant כדי לייצר קבוצות חלבונים וקבצי פפטידים. באמצעות כלי מניפולציה של טקסט, ארגן את הפלטים שהתקבלו מממשק המשתמש הגרפי של החיפוש, Peptide-Shaker" ו-MaxQuant.
שרשר את שתי רשימות הפפטידים למערך נתונים יחיד שכותרתו SGPS-MQ-Peptides.tabular. קבץ את רשימת הפפטידים המשורשרת כדי לחסל רצפי פפטידים כפולים ולקבל את הרשימה הסופית של פפטידים מיקרוביאליים ייחודיים. לאימות PepQuery2, הזן את רשימת הפפטידים המיקרוביאליים המובחנים, מערכי הנתונים הספקטרליים של MS, מסד הנתונים האנושי UniProt עם איזופורמים ומסד הנתונים של רצף החלבונים המזהמים.
הפעל את Cut"על דוחות הפפטיד מ- Search GUI, Peptide-Shaker" ו- MaxQuant "כדי לחלץ את רצפי הפפטידים וערכי החלבון הנלווים. שרשר את רצפי הפפטידים וערכי החלבון משתי התוכניות כדי ליצור מערך נתונים משולב חדש של חלבון פפטיד, ולאחר מכן הפעל את השאילתה Tabular על מערך הנתונים המשולב של חלבון הפפטיד והפפטידים המאומתים כדי להקצות כל פפטיד מאומת לערך החלבון הקשור אליו. קבוצה לשמירה על פפטידים מאומתים ייחודיים ומזהי UniProt המשויכים אליהם.
לאחר מכן, הפעל את Query Tabular"כדי לחלץ את מזהי ה-UniProt, וליצור רשימה שכותרתה Uniprot-ID מ-Peptides.tabular מאומת. העלה את מזהי ה-UniProt ל-UniProt כדי לאחזר את רצפי החלבונים המשויכים ולשמור אותם כקובץ UniProt FASTA חדש. הפעל קבצי מיזוג FASTA וסנן רצפים ייחודיים ב-UniProt FASTA החדש שנוצר, מסד הנתונים האנושי של UniProt עם איזופורמים ומסד הנתונים המזהם cRAP כדי ליצור מסד נתונים מאומת לכימות פפטידים.
השתמש במסד הנתונים המאומת של רצף החלבונים ובמערך הנתונים של MS כקלט עבור MaxQuant. מקובץ הפפטידים של MaxQuant, בחר רק פפטידים מיקרוביאליים והפעל את Cut" כדי לחלץ רק רצפי פפטידים מיקרוביאליים מקובץ הבחירה. קבץ את קובץ ה-Cut"כדי להרכיב רשימה של פפטידים מיקרוביאליים מכומתים.
השתמש בקובץ רשימת הפפטידים המיקרוביאליים הכמותיים כקלט עבור Unipept כדי לבצע ביאורים טקסונומיים ופונקציונליים. חלץ את תפוקות Unipept, במיוחד עץ הטקסונומיה המיקרוביאלית ועץ חלבוני ועדת האנזים המיקרוביאלי. כדי להציג את הטקסונומיה המיקרוביאלית ועצי החלבון EC, בחר את מערך הנתונים ופתח את האפשרויות.
לחץ על Visualize, ואחריו על Unipept Taxonomy Viewer. לקבלת הביאורים הטקסונומיים והפונקציונליים בתבנית טבלה, לחץ על סמל העין של ערכת הנתונים הטבלאית בשם Unipept_peptinfo. גלול כדי לסקור כל פפטיד בשורה משלו ובעמודות המידע המתאימות לו.
לפני ביצוע ניתוח סטטיסטי עם MSstatsTMT, הפעל את Select" בקובץ קבוצות החלבונים MaxQuant כדי ליצור מערכי נתונים נפרדים עבור חלבונים מיקרוביאליים ואנושיים. חלבונים אלה מכילים תגי טקסונומיה המציינים את מקורם. אל תכלול חלבונים מזהמים המסומנים בתג con_.
שמור רק חלבונים מיקרוביאליים עם תגים כגון _9laco"וחלבונים אנושיים עם התג _human", בטבלאות Microbial_Proteins""ו-Human_Proteins", בהתאמה. לבסוף, באמצעות MSstatsTMT, בצע ניתוח סטטיסטי עם קובץ הראיות MaxQuant והחלבונים המיקרוביאליים או האנושיים שנבחרו. לחץ על סמל העין כדי להציג את העלילות המתקבלות.
בסך הכל 2,595,745 רצפי חלבונים נאספו למסד נתונים מקיף, שצומצם לאחר מכן למסד נתונים ממוקד יותר המכיל 21,289 רצפי חלבונים לזיהוי פפטידים יעיל. באמצעות ממשק משתמש גרפי לחיפוש, פפטיד-שייקר ו-MaxQuant, זוהו 196 פפטידים מיקרוביאליים מובחנים. PepQuery2 אישר 134 פפטידים מיקרוביאליים המקושרים ל-73 רצפי חלבונים, ויצר מסד נתונים מאומת לכימות.
MaxQuant סיפק קובץ פפטידים המכיל 3,203 פפטידים, עם 155 פפטידים מיקרוביאליים מכומתים. ניתוח Unipept חשף את לקטובצילוס כסוג הנפוץ ביותר, וטרנספראזות מסוג 2 כקטגוריית האנזימים הנפוצה ביותר מבין 155 פפטידים מיקרוביאליים מכומתים. ניתוח MSstatsTMT ייצר תרשימי וולקנו והשוואה הממחישים חלבונים בעלי ביטוי דיפרנציאלי, והראו כי שלושה חלבוני לקטובצילוס היו מווסתים במקרי סרטן השחלות לעומת מקרים שפירים.