JoVE Logo

Sign In

A subscription to JoVE is required to view this content. Sign in or start your free trial.

In This Article

  • Summary
  • Abstract
  • Introduction
  • Protocol
  • תוצאות
  • Discussion
  • Disclosures
  • Acknowledgements
  • Materials
  • References
  • Reprints and Permissions

Summary

אנו מציגים כלי לביולוגיה של מערכות JUMPn כדי לבצע ולהמחיש ניתוח רשת עבור נתוני פרוטאומיקה כמותית, עם פרוטוקול מפורט הכולל עיבוד נתונים מראש, אשכולות ביטוי משותף, העשרת מסלולים וניתוח רשת אינטראקציות חלבון-חלבון.

Abstract

עם ההתקדמות האחרונה בטכנולוגיות פרוטאומיקה מבוססות ספקטרומטריית מסות, פרופיל עמוק של מאות פרוטאומים הפך אפשרי יותר ויותר. עם זאת, הפקת תובנות ביולוגיות ממערכי נתונים כה חשובים היא מאתגרת. כאן אנו מציגים תוכנה מבוססת ביולוגיה של מערכות JUMPn, ואת הפרוטוקול הקשור אליה כדי לארגן את הפרוטאום לאשכולות ביטוי משותף של חלבונים על פני דגימות ורשתות אינטראקציה בין חלבונים לחלבונים (PPI) המחוברות באמצעות מודולים (למשל, קומפלקסים של חלבונים). באמצעות פלטפורמת R/Shiny, תוכנת JUMPn מייעלת את הניתוח של אשכולות ביטויים משותפים, העשרת מסלולים וזיהוי מודול PPI, עם הדמיית נתונים משולבת וממשק ידידותי למשתמש. השלבים העיקריים של הפרוטוקול כוללים התקנה של תוכנת JUMPn, הגדרת חלבונים המבוטאים באופן דיפרנציאלי או פרוטאום מווסת (dys), קביעת אשכולות ביטוי משותף משמעותיים ומודולי PPI, והדמיית תוצאות. בעוד שהפרוטוקול מודגם באמצעות פרופיל פרוטאום מבוסס תוויות איזובריות, JUMPn ישים בדרך כלל למגוון רחב של מערכי נתונים כמותיים (למשל, פרוטאומיקה ללא תוויות). התוכנה והפרוטוקול של JUMPn מספקים אפוא כלי רב עוצמה כדי להקל על פרשנות ביולוגית בפרוטאומיקה כמותית.

Introduction

פרוטאומיקה מבוססת ספקטרומטריית מסה של רובה ציד הפכה לגישה המרכזית לניתוח מגוון הפרוטאומים של דגימות מורכבות1. עם ההתקדמות האחרונה במכשור ספקטרומטריית מסות 2,3, כרומטוגרפיה 4,5, זיהוי ניידות יונים6, שיטות רכישה (7 בלתי תלויות בנתונים ורכישה תלוית נתונים8), גישות כימות (שיטת תיוג פפטיד איזוברי רב-plex, למשל, TMT 9,10, וכימות ללא תווית11,12) ואסטרטגיות ניתוח נתונים/ פיתוח תוכנה 13,14,15,16,17,18, כימות של הפרוטאום כולו (למשל, מעל 10,000 חלבונים) הוא כיום שגרתי 19,20,21. עם זאת, כיצד להשיג תובנות מכניסטיות ממערכי נתונים כמותיים כה עמוקים עדיין מאתגר22. ניסיונות ראשוניים לחקור מערכי נתונים אלה הסתמכו בעיקר על ביאור של אלמנטים בודדים של הנתונים, תוך התייחסות לכל רכיב (חלבון) באופן עצמאי. עם זאת, מערכות ביולוגיות והתנהגותן אינן ניתנות להסבר אך ורק על ידי בחינת מרכיבים בודדים23. לכן, גישה מערכתית הממקמת את הביומולקולות הכימותיות בהקשר של רשתות אינטראקציה חיונית להבנת מערכות מורכבות והתהליכים הקשורים אליהן כגון עוברי, תגובה חיסונית ופתוגנזה של מחלות אנושיות24.

ביולוגיה של מערכות מבוססות רשת התפתחה כפרדיגמה רבת עוצמה לניתוח נתוני פרוטאומיקה כמותית בקנה מידה גדול 25,26,27,28,29,30,31,32,33. מבחינה מושגית, מערכות מורכבות כגון תאי יונקים יכולות להיות ממודלות כרשת היררכית34,35, שבה המערכת כולה מיוצגת בשכבות: תחילה על ידי מספר רכיבים גדולים, שכל אחד מהם לאחר מכן ממודל באופן איטרטיבי על ידי תת-מערכות קטנות יותר. מבחינה טכנית, המבנה של דינמיקת פרוטאום יכול להיות מוצג על ידי רשתות מחוברות זו בזו של אשכולות חלבונים המתבטאים במשותף (מכיוון שגנים/חלבונים המתבטאים במשותף חולקים לעתים קרובות פונקציות ביולוגיות דומות או מנגנונים של ויסות36) ומודולי PPI בעלי אינטראקציה פיזית37. כדוגמה אחרונה25, יצרנו פרופילים טמפורליים של פרוטאום שלם ופוספופרוטאום במהלך הפעלת תאי T והשתמשנו ברשתות ביטוי משותפות אינטגרטיביות עם PPIs כדי לזהות מודולים פונקציונליים המתווכים יציאה של תאי T. מספר מודולים הקשורים לביו-אנרגיה הודגשו ואומתו בניסוי (לדוגמה, מודולי המיטוריבוסום וה-IV המורכבים25, ומודול פחמן אחד38). בדוגמה אחרת26, הרחבנו עוד יותר את הגישה שלנו לחקר הפתוגנזה של מחלת אלצהיימר, ותיעדפנו בהצלחה את התקדמות המחלה במודולים ובמולקולות הקשורים להתקדמות המחלה. חשוב לציין שרבות מהתגליות הבלתי משוחדות שלנו אומתו על ידי קבוצות חולים עצמאיות26,29 ו/או מודלים של עכברי מחלה26. דוגמאות אלה המחישו את כוחה של גישת הביולוגיה של המערכות לניתוח מנגנונים מולקולריים באמצעות פרוטאומיקה כמותית ושילובי אומיקה אחרים.

כאן אנו מציגים את JUMPn, תוכנה יעילה החוקרת נתוני פרוטאומיקה כמותית באמצעות גישות ביולוגיות של מערכות מבוססות רשת. JUMPn משמש כמרכיב במורד הזרם של חבילת התוכנה מבוססת JUMP פרוטאומיקה 13,14,39, ומטרתו למלא את הפער מכימות חלבונים בודדים למסלולים בעלי משמעות ביולוגית ומודולי חלבונים באמצעות גישת הביולוגיה של המערכות. על-ידי לקיחת מטריצת הכימות של חלבונים המבוטאים באופן דיפרנציאלי (או המשתנה ביותר) כקלט, JUMPn שואף לארגן את הפרוטאום בהיררכיה שכבתית של צבירי חלבונים המתבטאים יחד על פני דגימות ומודולי PPI המחוברים בצפיפות (למשל, קומפלקסים של חלבונים), אשר מבוארים עוד יותר עם מסדי נתונים של מסלולים ציבוריים על ידי ניתוח ייצוג יתר (או העשרה) (איור 1). JUMPn פותחה עם פלטפורמת R/Shiny40 עבור ממשק ידידותי למשתמש ומשלבת שלושה מודולים פונקציונליים עיקריים: ניתוח אשכולות ביטוי משותף, ניתוח העשרת מסלולים וניתוח רשת PPI (איור 1). לאחר כל ניתוח, התוצאות מוצגות באופן אוטומטי באופן חזותי וניתנות לכוונון באמצעות פונקציות הווידג'ט R/מבריק וניתנות להורדה בקלות כטבלאות פרסום בתבנית Microsoft Excel. בפרוטוקול הבא, אנו משתמשים בנתוני פרוטאום שלמים כמותיים כדוגמה ומתארים את השלבים העיקריים של השימוש ב- JUMPn, כולל התקנת תוכנת JUMPn, ההגדרה של חלבונים המבוטאים באופן דיפרנציאלי או הפרוטאום המווסת (dys), ניתוח רשת ביטוי משותף וניתוח מודול PPI, הדמיה ופרשנות של תוצאות, וירי בעיות. תוכנת JUMPn זמינה באופן חופשי ב-GitHub41.

Protocol

הערה: בפרוטוקול זה, השימוש ב- JUMPn מודגם על ידי שימוש במערך נתונים שפורסם של פרופיל פרוטאום שלם במהלך התמיינות תאי B המכומת על ידי ריאגנט התווית האיזוברית TMT27.

1. הגדרת תוכנת JUMPn

הערה: שתי אפשרויות מסופקות להגדרת תוכנת JUMPn: (i) התקנה במחשב מקומי לשימוש אישי; וכן (ii) פריסה של JUMPn בשרת מבריק מרוחק עבור משתמשים מרובים. עבור התקנה מקומית, מחשב אישי עם גישה לאינטרנט ו- ≥4 Gb של זיכרון RAM מספיק כדי להפעיל ניתוח JUMPn עבור ערכת נתונים עם גודל מדגם קטן (n < 30); זיכרון RAM גדול יותר (לדוגמה, 16 Gb) נחוץ לניתוח קוהורט גדול (לדוגמה, n = 200 דגימות).

  1. התקן את התוכנה במחשב מקומי. לאחר ההתקנה, אפשר לדפדפן האינטרנט להפעיל את JUMPn ולתת לניתוח לפעול במחשב המקומי.
    1. התקן אנקונדה42 או מיניקונדה43 בהתאם להוראות המקוונות.
    2. הורד את קוד המקור JUMPn41. לחץ פעמיים כדי לפתוח את הקובץ שהורדת JUMPn_v_1.0.0.0.zip; תיקייה חדשה בשם JUMPn_v_1.0.0 תיווצר.
    3. פתח מסוף שורת הפקודה. ב- Windows, השתמש בשורת הבקשה של Anaconda. ב- MacOS, השתמש ביישום הטרמינל המובנה.
    4. צור את סביבת JUMPn Conda: קבל את הנתיב המוחלט של התיקיה JUMPn_v_1.0.0 (לדוגמה, /path/to/to/JUMPn_v_1.0.0). כדי ליצור ולהפעיל סביבת Conda ריקה הקלד את הפקודות הבאות במסוף
      conda create -p /path/to/JUMPn_v_1.0.0/JUMPn -y
      conda הפעל /path/to/JUMPn_v_1.0.0/JUMPn
    5. התקן יחסי תלות של JUMPn: התקן R (במסוף, הקלד conda להתקין -c conda-forge r=4.0.0 -y), שנה את הספריה הנוכחית לתיקיה JUMPn_v_1.0.0 (במסוף, הקלד נתיב תקליטור /to/JUMPn_v_1.0.0), והתקן את חבילות התלות (במסוף, הקלד אתחול Rscript. R)
    6. הפעל את JUMPn בדפדפן האינטרנט: שנה את הספריה הנוכחית לתיקיית הביצוע (במסוף, הקלד ביצוע תקליטור) והפעל את JUMPn (במסוף, סוג R -e "מבריק::runApp()")
    7. לאחר ביצוע האמור לעיל, מסך המסוף יופיע בהאזנה ב- http://127.0.0.1:XXXX (כאן XXXX מציין 4 מספרים אקראיים). העתק והדבק http://127.0.0.0.1:XXXX בדפדפן האינטרנט, שבו יופיע דף הפתיחה של JUMPn (איור 2).
  2. פריסה בשרת מבריק. דוגמאות לשרת מבריק כוללות את שרת shinyapps.io המסחרי או כל שרת מבריק הנתמך באופן מוסדי.
    1. הורד והתקן את RStudio בעקבות ההוראה44.
    2. קבל את הרשאת הפריסה עבור השרת המבריק. עבור שרת shinyapps.io, הגדר את חשבון המשתמש על-ידי ביצוע ההוראה45. עבור שרת מבריק מוסדי, פנה למנהל השרת לקבלת בקשת הרשאות.
    3. הורד את קוד המקור JUMPn41 למחשב המקומי; ההתקנה אינה הכרחית. פתח את השרת. R או ui. R קבצים ב- RStudio ולחץ על התפריט הנפתח פרסם לשרת בפינה השמאלית העליונה של RStudio IDE.
    4. בחלונית 'פרסם לחשבון' , הקלד את כתובת השרת. לחץ על לחצן פרסם . פריסה מוצלחת מאומתת עם ניתוב מחדש אוטומטי מ- RStudio לשרת RShiny שבו נפרס היישום.

2. הרצת הדגמה באמצעות ערכת נתונים לדוגמה

הערה: JUMPn מציע הרצת הדגמה באמצעות ערכת הנתונים של פרוטאומיקה של תאי B שפורסמה. הרצת ההדגמה ממחישה זרימת עבודה יעילה שלוקחת את מטריצת הכימות של חלבונים המבוטאים באופן דיפרנציאלי כקלט ומבצעת אשכולות ביטוי משותף, העשרת מסלולים וניתוח רשת PPI ברצף.

  1. בדף הבית של JUMPn (איור 2), לחץ על לחצן התחלת ניתוח כדי להתחיל בניתוח JUMPn.
  2. בפינה השמאלית התחתונה של דף ניתוח התחלה (איור 3), לחץ על לחצן העלה הדגמה B Cell Proteomic Data ; תופיע תיבת דו-שיח המודיעה על הצלחת העלאת הנתונים.
  3. בפינה השמאלית התחתונה של הדף, לחץ על שלח ניתוח JUMPn כפתור כדי ליזום את הפעלת ההדגמה באמצעות פרמטרי ברירת מחדל; יופיע סרגל התקדמות המציין את מהלך הניתוח. המתן עד למילוי סרגל ההתקדמות (3 דקות צפויות).
  4. לאחר סיום הפעלת ההדגמה, תופיע תיבת דו-שיח עם הודעת הרצת ההצלחה והנתיב המוחלט לתיקיית התוצאות. לחץ על המשך לתוצאות כדי להמשיך.
  5. דף האינטרנט ינחה תחילה את המשתמש לתוצאות אשכול הביטויים המשותפים על-ידי WGCNA. לחץ על הצג תוצאות בחלון תיבת הדו-שיח כדי להמשיך.
  6. מצא את תבניות הביטוי המשותף של חלבונים בצד שמאל של דף התוצאה 1: דף פלט WGCNA . לחץ על התיבה הנפתחת בחר את תבנית הביטוי כדי לנווט בין שתי תבניות איור:
    1. בחר מגמות כדי להציג את תרשים המגמות, כאשר כל שורה מייצגת את שפע החלבון הבודד בין הדגימות. הצבע של כל קו מייצג עד כמה קרובה תבנית הביטוי לקונצנזוס של אשכול הביטויים המשותפים (כלומר, "eigengene" כפי שהוגדר על ידי אלגוריתם WGCNA).
    2. בחר Boxplot כדי להציג תבניות של ביטויים משותפים בתבנית boxplot עבור כל דגימה.
  7. הצג את מפת החום של העשרת המסלול/אונטולוגיה בצד ימין של דף הפלט של WGCNA. המסלולים המועשרים ביותר עבור כל צביר מוצגים יחד במפת חום, כאשר עוצמת הצבע משקפת את ערך ה-p המותאם לבנימיני-הוכברג.
  8. גלול מטה בדף האינטרנט כדי להציג את תבנית הביטוי עבור חלבונים בודדים.
    1. השתמש בתיבה הנפתחת בחר את אשכול ביטויי המשותף כדי להציג חלבונים מכל אשכול (ברירת המחדל היא אשכול 1). בחר חלבון מסוים בטבלה, שעליו תעודכן באופן אוטומטי תרשים המוט שמתחת לטבלה כדי לשקף את שפע החלבון שלו.
    2. חפש שמות חלבונים ספציפיים באמצעות תיבת החיפוש בצד ימין של הטבלה עבור חלבון מסוים.
  9. כדי להציג את תוצאות PPI, לחץ על עמוד התוצאות 2: פלט PPI בחלק העליון.
  10. לחץ על בחר את אשכול הביטויים המשותפים כדי להציג את התוצאות עבור אשכול ביטויים משותפים ספציפי (ברירת המחדל היא אשכול 1). התצוגות של כל לוחות האיורים בדף זה יעודכנו עבור האשכול החדש שנבחר.
  11. הצגת רשתות ה- PPI עבור אשכול הביטויים המשותפים שנבחר בחלונית האיור השמאלית:
    1. לחץ על התיבה הנפתחת בחר לפי קבוצה כדי לסמן מודולי PPI בודדים בתוך הרשת. לחץ על התיבה הנפתחת בחר תבנית פריסת רשת כדי לשנות את פריסת הרשת (ברירת המחדל היא על-ידי Fruchterman Reingold).
    2. השתמש בעכבר ובמשטח המגע כדי לבצע שלבים 2.11.3-2.11.5.
    3. הגדל את התצוגה או הקטן את רשת ה- PPI לפי הצורך. שמות הגנים של כל צומת ברשת יוצגו כאשר מוגדלים מספיק.
    4. כאשר מגדילים את התצוגה, בחרו ולחצו על חלבון מסוים כדי להדגיש את החלבון ואת שכניו ברשת.
    5. גרור צומת מסוים (חלבון) ברשת כדי לשנות את מיקומו בפריסה; ובכך ניתן לארגן מחדש את פריסת הרשת על ידי המשתמש.
  12. בחלונית הימנית של דף התוצאות של PPI, הצג את המידע ברמת האשכול של הביטוי המשותף המסייע בפענוח תוצאות PPI:
    1. הצג את תבנית הביטוי המשותף של האשכול שנבחר כ- boxplot כברירת מחדל.
    2. לחץ על התיבה הנפתחת בחר את תבנית הביטוי לקבלת מידע נוסף או תצוגה כאמור בשלבים 2.12.3-2.12.5.
    3. בחר מגמות כדי להציג מגמות המתארות עבור תבנית הביטוי המשותף.
    4. בחר מסלול Barplot כדי להציג מסלולים מועשרים באופן משמעותי עבור אשכול הביטויים המשותפים.
    5. בחר תרשים מעגל מסלול כדי להציג מסלולים מועשרים באופן משמעותי עבור אשכול הביטויים המשותפים בתבנית העלילה המעגלית.
  13. גלול מטה בדף האינטרנט של דף התוצאה 2: פלט PPI כדי להציג תוצאות ברמת מודול PPI הבודד. לחץ על התיבה הנפתחת בחר את המודול כדי לבחור מודול PPI ספציפי לתצוגה (Cluster1: Module 1 מוצג כברירת מחדל).
  14. הצג את מודול ה- PPI בחלונית השמאלית. כדי לתפעל את תצוגת הרשת, בצע את השלבים 2.11.2-2.11.5.
  15. הצג את תוצאות העשרת המסלול/אונטולוגיה בלוח הימני. לחץ על התיבה הנפתחת בחר סגנון ביאור נתיב לקבלת מידע נוסף ותציג:
    1. בחר Barplot כדי להציג מסלולים מועשרים באופן משמעותי עבור מודול ה- PPI שנבחר.
    2. בחר תרשים מעגל כדי להציג מסלולים מועשרים באופן משמעותי עבור מודול ה- PPI שנבחר בתבנית של תרשים מעגל.
    3. בחר מפת חום כדי להציג מסלולים מועשרים באופן משמעותי ואת שמות הגנים המשויכים ממודול ה- PPI שנבחר.
    4. בחר טבלה כדי להציג את תוצאות העשרת המסלולים המפורטות, כולל שם המסלולים/מונחי אונטולוגיה, שמות גנים וערך P על ידי הבדיקה המדויקת של פישר.
  16. הצג את טבלת הפרסום בתבנית גיליון אלקטרוני: בצע את הנתיב המוחלט (המודפס בראש שני עמודי התוצאות) ומצא את טבלת הגיליון האלקטרוני של הפרסום בשם ComprehensiveSummaryTables.xlsx.

3. הכנת קובץ הקלט והעלאה ל- JUMPn

הערה: JUMPn לוקח כקלט את מטריצת הכימות של החלבונים המבוטאים באופן דיפרנציאלי (השיטה המפוקחת) או של החלבונים המשתנים ביותר (שיטה לא מפוקחת). אם מטרת הפרויקט היא להבין חלבונים שהשתנו במצבים מרובים (למשל, קבוצות מחלה שונות, או ניתוח סדרתי זמן של תהליכים ביולוגיים), עדיפה השיטה המפוקחת לביצוע ניתוח DE; אחרת, גישה לא מפוקחת של בחירת החלבונים המשתנים ביותר עשויה לשמש למטרה האקספלורטורית.

  1. צור את טבלת כימות החלבון, כאשר כל חלבון הוא שורות וכל דגימה היא עמודות. השג זאת באמצעות חבילת תוכנות פרוטאומיקה מודרנית מבוססת ספקטרומטריית מסה (לדוגמה, חבילת JUMP 13,14,39, תגלית פרוטאום, Maxquant 15,46).
  2. הגדר את הפרוטאום המשתנה.
    1. השתמש בתוצאות הניתוח הסטטיסטי שמספקת חבילת התוכנה לפרוטאומיקה כדי להגדיר חלבונים בעלי ביטוי דיפרנציאלי (DE) (לדוגמה, עם ערך p מותאם < 0.05).
    2. לחלופין, משתמשים יכולים לעקוב אחר קוד Rלדוגמה 47 כדי להגדיר DE או את רוב החלבונים המשתנים.
  3. עצב את קובץ הקלט באמצעות הפרוטאום המשתנה המוגדר.
    הערה: תבנית קובץ הקלט הנדרשת (איור 4) כוללת שורת כותרת; העמודות כוללות הצטרפות לחלבון (או כל מזהה ייחודית), GN (סמלי גנים רשמיים), תיאור חלבון (או כל מידע שסופק על-ידי המשתמש), ולאחר מכן כימות חלבונים של דגימות בודדות.
    1. בצע את סדר העמודות שצוין בשלב 3.1, אך שמות העמודות של הכותרת גמישים למשתמש.
    2. עבור פרוטאום מכמת TMT (או דומה), השתמש בעוצמת כתב TMT המסוכמת כערכי כימות קלט. עבור נתונים ללא תוויות, השתמש בספירות ספקטרליות מנורמלות (לדוגמה, NSAF48) או בשיטה מבוססת עוצמה (לדוגמה, עוצמת LFQ או עוצמת חלבון iBAQ המדווחת על-ידי Maxquant46).
    3. ערכים חסרים מותרים לניתוח JUMPn. הקפד לתייג אותם כ- NA במטריצת הכימות. עם זאת, מומלץ להשתמש רק בחלבונים עם כימות ביותר מ -50% מהדגימות.
    4. שמור את קובץ הקלט שהתקבל כתבנית .txt, .xlsx או .csv (כל השלושה נתמכים על-ידי JUMPn).
  4. העלה קובץ קלט:
    1. לחץ על לחצן דפדפן ובחר את קובץ הקלט (איור 3, החלונית השמאלית); תבנית הקובץ (xlsx, csv ו - txt נתמכים) תזוהה באופן אוטומטי.
    2. אם קובץ הקלט מכיל ערכי כימות דמויי עוצמה (לדוגמה, אלה שנוצרו על-ידי חבילת JUMP39) או דמויי-יחס (לדוגמה, מ-Proteome Discoverer), בחר כן עבור האפשרות הפעל יומן 2-טרנספורמציה של נתונים; אחרת, ייתכן שהנתונים כבר עברו שינוי יומן, לכן בחר לא עבור אפשרות זו.

4. ניתוח אשכולות ביטויים משותפים

הערה: הקבוצה שלנו 25,26,27 ואחרים 28,29,31 הוכיחו כי WGCNA49 היא שיטה יעילה לניתוח אשכולות ביטוי משותף של פרוטאומיקה כמותית. JUMPn עוקב אחר הליך בן 3 שלבים עבור ניתוח WGCNA25,50: (i) הגדרה ראשונית של אשכולות גנים/חלבונים בביטוי משותף על ידי חיתוך עץ דינמי51 בהתבסס על מטריצת החפיפה הטופולוגית (TOM; נקבעת על ידי דמיון בכימות בין גנים/חלבונים); (2) מיזוג של אשכולות דומים כדי להפחית את היתירות (בהתבסס על דנדרוגרמה של קווי דמיון eigengene); ו-(iii) הקצאה סופית של גנים/חלבונים לכל צביר העולה על ניתוק המתאם המינימלי של פירסון.

  1. הגדר את הפרמטרים של WGCNA (איור 3, החלונית האמצעית). שלושת הפרמטרים הבאים שולטים בשלושת השלבים, בהתאמה:
    1. הגדר גודל אשכול מינימלי כ- 30. פרמטר זה מגדיר את המספר המינימלי של חלבונים הנדרשים עבור כל אשכול ביטוי משותף בשלב הראשוני (i) של חיתוך עץ דינמי היברידי מבוסס TOM. ככל שהערך גדול יותר, כך מספר האשכולות המוחזרים על ידי האלגוריתם קטן יותר.
    2. הגדר את מרחק האשכולות המינימלי כ- 0.2. הגדלת ערך זה (לדוגמה, מ- 0.2-0.3) עלולה לגרום למיזוג אשכולות רב יותר במהלך שלב (ii), וכתוצאה מכך לגרום למספר קטן יותר של אשכולות.
    3. הגדר kME מינימלי כ- 0.7. חלבונים יוקצו לאשכול המתואם ביותר המוגדר בשלב (ii), אך רק חלבונים עם מתאם פירסון העוברים את הסף הזה יישמרו. חלבונים שנכשלים בשלב זה לא יוקצו לאשכול כלשהו (אשכול 'NA' עבור החלבונים שנכשלו בדו"ח הסופי).
  2. ליזום את הניתוח. ישנן שתי דרכים להגיש את ניתוח אשכולות הביטויים המשותפים:
    1. לחץ על לחצן שלח ניתוח JUMPn בפינה השמאלית התחתונה כדי ליזום את הניתוח המקיף של WGCNA באופן אוטומטי ואחריו ניתוח רשת PPI.
    2. לחלופין, בחר לבצע את שלב WGCNA בלבד (במיוחד לצורך כוונון פרמטרים; ראה שלבים 4.2.3-4.2.4):
    3. לחץ על לחצן פרמטרים מתקדמים בתחתית הדף ניתוח התחלה ; חלון פרמטר חדש יופיע. בווידג'ט התחתון , בחר מצב ניתוח, בחר WGCNA בלבד ולאחר מכן לחץ על בטל כדי להמשיך.
    4. בדף ניתוח התחלה , לחץ על לחצן שלח ניתוח JUMPn .
    5. בכל מקרה לעיל, סרגל התקדמות יופיע עם הגשת הניתוח.
      הערה: לאחר סיום הניתוח (בדרך כלל < דקה אחת עבור ניתוח WGCNA בלבד ו- <3 דקות לניתוח מקיף), תופיע תיבת דו-שיח עם הודעת הרצת הצלחה והנתיב המוחלט לתיקיית התוצאות.
  3. בחנו את תוצאות WGCNA כפי שהן מתוארות בשלבים 2.4-2.8 (איור 5). שים לב שהנתיב המוחלט co_exp_clusters_3colums.txt הקובץ מסומן בראש דף התוצאות: פלט WGCNA כדי לרשום את חברות האשכול של כל חלבון ולהשתמש בו כקלט לניתוח PPI בלבד .
  4. פתרון בעיות. נדונים שלושת המקרים הנפוצים הבאים. לאחר עדכון הפרמטרים כפי שיפורט להלן, בצע את השלבים 4.2.2-4.2.4 כדי ליצור תוצאות WGCNA חדשות.
    1. אם תבנית ביטוי משותף חשובה אחת צפויה מהנתונים אך הוחמצה על ידי האלגוריתם, בצע את השלבים 4.4.2-4.4.4
    2. צביר חסר סביר במיוחד עבור אשכולות קטנים של ביטוי משותף, כלומר רק מספר מוגבל (למשל, <30) של חלבונים המציגים תבנית זו. לפני הניתוח מחדש, בחנו מחדש את קובץ הקלט של מטריצת כימות החלבון ואתרו מספר חלבוני בקרה חיוביים הדבקים בתבנית ביטוי משותף חשובה זו.
    3. כדי להציל את האשכולות הקטנים, להקטין את גודל האשכול המינימלי (לדוגמה, 10; גודל אשכול קטן מ-10 עשוי שלא להיות חזק ולכן לא מומלץ), והקטן את מרחק האשכול המינימלי (למשל, 0.1; כאן מותר גם להגדיר כ-0, מה שאומר שמיזוג אשכולות אוטומטי יידלג).
    4. לאחר ביצוע שלב אשכולות הביטויים המשותפים עם הפרמטרים המעודכנים, תחילה, בדוק אם האשכול ניצל מתוכניות תבנית ה- Co-Expression, ולאחר מכן בדוק את הפקדים החיוביים על-ידי חיפוש בגישת החלבון שלהם מכימות חלבונים מפורט (הקפד לבחור את אשכול הביטויים המשותפים המתאים מהווידג'ט הנפתח בצד שמאל לפני החיפוש).
      הערה: ייתכן שיהיה צורך באיטרציות מרובות של כוונון פרמטרים והפעלה חוזרת להצלה.
    5. אם יש יותר מדי חלבונים שלא ניתן להקצות לאשכול כלשהו, בצע את השלבים 4.4.6-4.4.7.
      הערה: בדרך כלל, אחוז קטן (בדרך כלל <10%) מהחלבונים לא יכול להיות מוקצה לאשכול כלשהו מכיוון שאלו עשויים להיות חלבונים חריגים שלא עקבו אחר אף אחד מדפוסי הביטוי הנפוצים של מערך הנתונים. עם זאת, אם אחוז כזה הוא משמעותי (למשל, >30%), זה מצביע על כך שקיימים דפוסי ביטוי משותף נוספים שלא ניתן להתעלם מהם.
    6. הקטן הן את הפרמטרים 'גודל אשכול מינימלי' וגם את הפרמטרים 'מרחק אשכולות מינימלי' כדי להקל על מצב זה על-ידי זיהוי אשכולות 'חדשים' של ביטויים משותפים.
    7. בנוסף, הפחיתו את פרמטר המתאם המינימלי של פירסון (kME) כדי לכווץ את חלבוני ה-'NA cluster' האלה.
      הערה: כוונון פרמטר זה לא ייצור אשכולות חדשים אלא יגדיל את גודלם של אשכולות 'קיימים' על ידי קבלת יותר חלבונים שנכשלו בעבר עם הסף התחתון; עם זאת, זה גם יגדיל את ההטרוגניות של כל צביר, שכן חלבונים רועשים יותר מותרים כעת.
    8. לשני אשכולות יש הבדל מינורי מאוד של דפוסים; למזג אותם לאשכול אחד לאחר שלבים 4.4.9-4.4.11.
    9. הגדל את הפרמטר מרחק אשכול מינימלי כדי לפתור את הבעיה.
    10. עם זאת, במצבים מסוימים, ייתכן שהאלגוריתם לעולם לא יחזיר את התבנית הרצויה; ברגע כזה, התאמה ידנית או עריכה של חברות באשכול בקובץ co_exp_clusters_3colums.txt (קובץ משלב 4.3) למיזוג.
    11. קח את הקובץ שלאחר העריכה כקלט לניתוח רשת PPI במורד הזרם. במקרה של עריכה ידנית, הצדק את הקריטריונים של הקצאת אשכולות, ורשם את הליך העריכה הידנית.

5. ניתוח רשת אינטראקציות חלבון-חלבון

הערה: על-ידי הכנסת אשכולות ביטויים משותפים לרשת PPI, כל אשכול ביטוי משותף מחולק עוד יותר למודולי PPI קטנים יותר. הניתוח מתבצע עבור כל אשכול ביטוי משותף וכולל שני שלבים: בשלב הראשון, JUMPn מעביר חלבונים מאשכול הביטוי המשותף לרשת PPI ומוצא את כל הרכיבים המחוברים (כלומר, אשכולות מרובים של צמתים/חלבונים מחוברים; כדוגמה, ראו איור 6A); לאחר מכן, קהילות או מודולים (של צמתים מחוברים בצפיפות) יזוהו עבור כל רכיב מחובר באופן איטרטיבי באמצעות שיטת מטריצת החפיפה הטופולוגית (TOM)52.

  1. קביעת תצורה של פרמטרים לניתוח רשת PPI (איור 3, לוח ימני).
    1. הגדר גודל מודול PPI מינימלי כ- 2. פרמטר זה מגדיר את הגודל המינימלי של הרכיבים המנותקים מניתוח השלב הראשון. כל רכיב קטן יותר מהפרמטר שצוין יוסר מהתוצאות הסופיות.
    2. הגדר את גודל מודול ה-PPI המרבי כ- 40. רכיבים גדולים ומנותקים שעוברים את הסף הזה יעברו ניתוח מבוסס TOM בשלב השני. ניתוח השלב השני יפצל כל רכיב גדול למודולים קטנים יותר: כל מודול מכיל ככל הנראה חלבונים המחוברים בצפיפות רבה יותר מהרכיב המקורי בכללותו.
  2. ליזום את הניתוח. ישנן שתי דרכים להגיש את ניתוח רשת PPI:
    1. לחץ על לחצן שלח ניתוח JUMPn כדי לבצע באופן אוטומטי את ניתוח ה- PPI לאחר ניתוח WGCNA כברירת מחדל.
    2. לחלופין, העלה תוצאות אשכולות מותאמות אישית של ביטויים משותפים ובצע ניתוח PPI בלבד בהתאם לשלבים 5.2.3-5.2.5.
    3. הכן קובץ קלט על-ידי ביצוע תבנית הקובץ co_exp_clusters_3colums.txt (ראה תת-סעיף 4.4).
    4. לחץ על לחצן פרמטרים מתקדמים בתחתית הדף ניתוח התחלה ; חלון פרמטר חדש יופיע. בהפעלה העליונה העלה תוצאת אשכול ביטוי משותף לניתוח 'PPI בלבד', לחץ על דפדפן כדי להעלות את קובץ הקלט שהוכן בשלב 5.2.3.
    5. בווידג'ט התחתון , בחר מצב ניתוח, בחר PPI בלבד ולאחר מכן לחץ על בטל כדי להמשיך. בדף ניתוח התחלה , לחץ על לחצן שלח ניתוח JUMPn .
  3. לאחר סיום הניתוח (בדרך כלל <3 דקות), בחנו את תוצאות ה-PPI כפי שהן מתוארות בשלבים 2.10-2.15 (איור 6).
  4. שלב מתקדם אופציונלי) התאמת מודולריזציה של PPI על ידי כוונון פרמטרים:
    1. הגדל את הפרמטר גודל מודול מקסימלי כדי לאפשר יותר חלבונים הכלולים בתוצאות ה- PPI. העלה רשת PPI מותאמת אישית כדי לכסות אינטראקציות לא מתועדות, בהתאם לשלבים 5.4.2-5.4.3.
    2. לחץ על לחצן פרמטרים מתקדמים בתחתית הדף ניתוח התחלה ; חלון פרמטר חדש יופיע. הכן את קובץ ה- PPI המותאם אישית, המכיל שלוש עמודות בתבנית של , C onnection ו- ; כאן מוצגים על ידי שמות הגנים הרשמיים של כל חלבון.
    3. בהעלאת מסד נתונים של PPI, לחץ על לחצן עיון כדי להעלות את קובץ ה- PPI המותאם אישית.

6. ניתוח העשרת מסלולים

הערה: המבנים ההיררכיים הנגזרים מ-JUMPn הן של אשכולות ביטויים משותפים והן של מודולי PPI שבתוכם מבוארים באופן אוטומטי עם מסלולים המיוצגים יתר על המידה באמצעות הבדיקה המדויקת של פישר. מסדי הנתונים של המסלולים/טופולוגיה שבהם נעשה שימוש כוללים אונטולוגיה של גנים (GO), KEGG, Hallmark ו-Reactome. משתמשים עשויים להשתמש באפשרויות מתקדמות כדי להעלות מסדי נתונים מותאמים אישית לצורך הניתוח (למשל, במקרה של ניתוח נתונים ממינים שאינם בני אדם).

  1. כברירת מחדל, ניתוח העשרת המסלולים מופעל באופן אוטומטי עם אשכולות ביטויים משותפים וניתוח רשת PPI.
  2. הצג את תוצאות העשרת המסלול:
    1. בצע את השלבים 2.7, 2.12 ו- 2.15 כדי להציג באופן חזותי פורמטים שונים בדפי התוצאות. הצג תוצאות מפורטות בטבלת הפרסום של גיליונות אלקטרוניים בקובץ ComprehensiveSummaryTables.xlsx (שלב 2.16).
  3. (שלב מתקדם אופציונלי) העלה מסד נתונים מותאם אישית לניתוח העשרת מסלולים:
    1. הכינו את קובץ הרקע של הגן, שבדרך כלל מכיל את שמות הגנים הרשמיים של כל הגנים של המין.
    2. הכן את קובץ ספריית האונטולוגיה בהתאם לשלבים 6.3.3-6.3.4.
    3. הורד את קבצי ספריית האונטולוגיה מאתרים ציבוריים, כולל EnrichR53, ו- MSigDB54. לדוגמה, הורד אונטולוגיה מדרוזופילה מאתר EnrichR55.
    4. ערוך את הקובץ שהורדת עבור התבנית הנדרשת עם שתי עמודות: שם המסלול כעמודה הראשונה, ולאחר מכן סמלי הגנים הרשמיים (המופרדים על-ידי "/") כעמודה השנייה. תבנית הקובץ המפורטת מתוארת בדף העזרה של תוכנת JUMPn R מבריקה.
      הערה: מצא קבצים לדוגמה של רקע גנים וספריית אונטולוגיה (תוך שימוש ב- Drosophila כמופע) באתר JUMPn GitHub56.
    5. לחץ על לחצן פרמטרים מתקדמים בתחתית הדף ניתוח התחלה; חלון פרמטר חדש יופיע.
    6. מצא העלאת קובץ רקע לניתוח העשרת מסלולים ולחץ על דפדפן כדי להעלות את קובץ הרקע שהוכן בשלב 6.3.1. לאחר מכן, בהפעלה, בחר את הרקע שישמש לניתוח העשרת מסלולים, לחץ על רקע שסופק על-ידי המשתמש.
    7. מצא העלה קובץ ספריית אונטולוגיה לניתוח העשרת מסלולים ולחץ על דפדפן כדי להעלות את קובץ ספריית האונטולוגיה שהוכן בשלבים 6.3.2-6.3.3.4. לאחר מכן, בהפעלה, בחר מסדי נתונים לניתוח העשרת מסלולים, לחץ על מסד נתונים שסופק על-ידי המשתמש בתבנית .xlsx.
  4. לחץ על לחצן שלח ניתוח JUMPn בפינה השמאלית התחתונה כדי ליזום את הניתוח באמצעות מסד הנתונים המותאם אישית.

7. ניתוח מערך נתונים עם גודל מדגם גדול

הערה: JUMPn תומך בניתוח של ערכת נתונים עם גודל מדגם גדול (עד 200 דגימות נבדקו). כדי להקל על התצוגה החזותית של גודל מדגם גדול, יש צורך בקובץ נוסף (בשם "קובץ מטא") המציין את קבוצת המדגם כדי להקל על הצגת תוצאות אשכולות של ביטויים משותפים.

  1. הכן והעלה קובץ מטא.
    1. הכן את קובץ המטא המציין מידע קבוצתי (לדוגמה, קבוצות בקרה ומחלות) עבור כל דגימה בהתאם לשלבים 7.1.2-7.1.3.
    2. ודא שקובץ המטא מכיל לפחות שתי עמודות: עמודה 1 חייבת להכיל את שמות הדגימות הזהים לשמות העמודות ולסדר מקובץ מטריצת כימות החלבון (כפי שהוכן בשלב 3.3); עמודה 2 ואילך תשמש להקצאה קבוצתית עבור כל מספר של תכונות שהוגדרו על-ידי המשתמש. מספר העמודות גמיש.
    3. ודא שהשורה הראשונה של קובץ המטא מכילה את שמות העמודות עבור כל עמודה; מהשורה השנייה ואילך, יש לרשום מידע לדוגמה בודד של קבוצות או תכונות אחרות (למשל, מין, גיל, טיפול וכו ').
    4. העלה את קובץ המטא על ידי לחיצה על לחצן פרמטרים מתקדמים בתחתית הדף ניתוח התחלה ; חלון פרמטר חדש יופיע. המשך לשלב 7.1.5
    5. מצא העלה פריט קובץ מטא ולחץ על דפדפן כדי להעלות את קובץ הרקע. אם התבנית הבלתי צפויה או שמות הדגימה שאין שני להם מזוהים על-ידי JUMPn, תופיע הודעת שגיאה לעיצוב נוסף של קובץ המטא (שלבים 7.1.1-7.1.3).
  2. התאם את הפרמטרים לניתוח אשכולות של ביטויים משותפים: הגדר מתאם מינימלי של פירסון כ- 0.2. פרמטר זה צריך להיות רגוע בשל גודל מדגם גדול יותר.
  3. לחץ על שלח את לחצן ניתוח JUMPn בפינה השמאלית התחתונה כדי לשלוח את הניתוח.
  4. הצגת תוצאות ניתוח: כל פלט הנתונים זהה למעט הצגת תבניות האשכול של ביטויים משותפים.
    1. בדף התוצאות 1: WGCNA Output , הצג באופן חזותי את אשכולות הביטויים המשותפים כתיבות עם דוגמאות המרובדות לפי קבוצות או התכונות של דגימות המוגדרות על-ידי המשתמש. כל נקודה בעלילה מייצגת את ה-eigengene (כלומר, תבנית הקונצנזוס של האשכול) המחושבת על ידי אלגוריתם WGCNA.
    2. אם המשתמש סיפק תכונות מרובות (לדוגמה, גיל, מין, טיפול וכו') כדי לקבץ את הדגימות, לחץ על התיבה הנפתחת בחר את תבנית הביטוי כדי לבחור תכונה אחרת לקיבוץ הדגימות.

תוצאות

השתמשנו בערכות הנתונים של פרוטאומיקה עמוקה שפורסמו עלידינו 25,26,27,30 (איורים 5 ואיור 6) וכן בסימולציות נתונים57 (טבלה 1) כדי לייעל ולהעריך את ביצועי JUMPn. לצורך ניתוח אשכו...

Discussion

כאן הצגנו את תוכנת JUMPn שלנו ואת הפרוטוקול שלה, אשר יושמו בפרויקטים מרובים לניתוח מנגנונים מולקולריים באמצעות נתוני פרוטאומיקה כמותית עמוקה 25,26,27,30,64. התוכנה והפרוטוקול של JUMPn עברו אופטימיזציה מלאה, כו...

Disclosures

למחברים אין מה לחשוף.

Acknowledgements

התמיכה במימון ניתנה על ידי המכונים הלאומיים לבריאות (NIH) (R01AG047928, R01AG053987, RF1AG064909, RF1AG068581 ו-U54NS110435) ו-ALSAC (ארגוני צדקה סוריים לבנוניים אמריקאים). ניתוח הטרשת הנפוצה בוצע במרכז הפרוטאומיקה והמטבולומיקה של בית החולים למחקר לילדים סנט ג'וד, שנתמך בחלקו על ידי מענק תמיכה במרכז הסרטן של NIH (P30CA021765). התוכן הוא באחריותם הבלעדית של המחברים ואינו מייצג בהכרח את הדעות הרשמיות של המכונים הלאומיים לבריאות.

Materials

NameCompanyCatalog NumberComments
MacBook Pro with a 2.3 GHz Quad-Core Processor running OS 10.15.7.Apple Inc.MacBook Pro 13''Hardware used for software development and testing
AnocondaAnaconda, Inc.version 4.9.2https://docs.anaconda.com/anaconda/install/
minicondaAnaconda, Inc.version 4.9.2https://docs.conda.io/en/latest/miniconda.html
RStudioRStudio Public-benefit corporationversion 4.0.3https://www.rstudio.com/products/rstudio/download/
Shiny ServerRStudio Public-benefit corporationhttps://shiny.rstudio.com/articles/shinyapps.html

References

  1. Aebersold, R., Mann, M. Mass-spectrometric exploration of proteome structure and function. Nature. 537, 347-355 (2016).
  2. Senko, M. W., et al. Novel parallelized quadrupole/linear ion trap/orbitrap tribrid mass spectrometer improving proteome coverage and peptide identification rates. Analytical Chemistry. 85, 11710-11714 (2013).
  3. Eliuk, S., Makarov, A. Evolution of orbitrap mass spectrometry instrumentation. Annual Review of Analytical Chemistry. 8, 61-80 (2015).
  4. Wang, H., et al. Systematic optimization of long gradient chromatography mass spectrometry for deep analysis of brain proteome. Journal of Proteome Research. 14, 829-838 (2015).
  5. Blue, L. E. Recent advances in capillary ultrahigh pressure liquid chromatography. Journal of Chromatography A. 1523, 17-39 (2017).
  6. Meier, F., et al. Online parallel accumulation-serial fragmentation (PASEF) with a novel trapped ion mobility mass spectrometer. Molecular & Cellular Proteomics. 17, 2534-2545 (2018).
  7. Ludwig, C., et al. Data-independent acquisition-based SWATH-MS for quantitative proteomics: a tutorial. Molecular Systems Biology. 14 (8), 8126 (2018).
  8. Zhang, Y. Y., Fonslow, B. R., Shan, B., Baek, M. C., Yates, J. R. Protein analysis by shotgun/bottom-up proteomics. Chemical Reviews. 113, 2343-2394 (2013).
  9. Wang, Z., et al. 27-Plex tandem mass tag mass spectrometry for profiling brain proteome in Alzheimer's disease. Analytical Chemistry. 92, 7162-7170 (2020).
  10. Li, J. M., et al. TMTpro reagents: a set of isobaric labeling mass tags enables simultaneous proteome-wide measurements across 16 samples. Nature Methods. 17 (4), 399-404 (2020).
  11. Collins, B. C., et al. Multi-laboratory assessment of reproducibility, qualitative and quantitative performance of SWATH-mass spectrometry. Nature Communications. 8 (1), 291 (2017).
  12. Navarro, P., et al. A multicenter study benchmarks software tools for label-free proteome quantification. Nature Biotechnology. 34, 1130 (2016).
  13. Wang, X. S., et al. A tag-based database search tool for peptide identification with high sensitivity and accuracy. Molecular & Cellular Proteomics. 13, 3663-3673 (2014).
  14. Li, Y. X., et al. JUMPg: An integrative proteogenomics pipeline identifying unannotated proteins in human brain and cancer cells. Journal of Proteome Research. 15, 2309-2320 (2016).
  15. Cox, J., Mann, M. MaxQuant enables high peptide identification rates, individualized p.p.b.-range mass accuracies and proteome-wide protein quantification. Nature Biotechnology. 26, 1367-1372 (2008).
  16. Kong, A. T., Leprevost, F. V., Avtonomov, D. M., Mellacheruvu, D., Nesvizhskii, A. I. MSFragger: ultrafast and comprehensive peptide identification in mass spectrometry-based proteomics. Nature Methods. 14, 513 (2017).
  17. Chi, H., et al. Comprehensive identification of peptides in tandem mass spectra using an efficient open search engine. Nature Biotechnology. 36, 1059 (2018).
  18. Demichev, V., Messner, C. B., Vernardis, S. I., Lilley, K. S., Ralser, M. DIA-NN neural networks and interference correction enable deep proteome coverage in high throughput. Nature Methods. 17, 41 (2020).
  19. High, A. A., et al. Deep proteome profiling by isobaric labeling, extensive liquid chromatography, mass spectrometry, and software-assisted quantification. Journal of Visualized Experiments: JoVE. (129), e56474 (2017).
  20. Wang, Z., et al. High-throughput and deep-proteome profiling by 16-plex tandem mass tag labeling coupled with two-dimensional chromatography and mass spectrometry. Journal of Visualized Experiments: JoVE. (162), e61684 (2020).
  21. Meier, F., Geyer, P. E., Winter, S. V., Cox, J., Mann, M. BoxCar acquisition method enables single-shot proteomics at a depth of 10,000 proteins in 100 minutes. Nature Methods. 15, 440 (2018).
  22. Sinitcyn, P., Rudolph, J. D., Cox, J. Computational methods for understanding mass spectrometry-based shotgun proteomics data. Annual Review of Biomedical Data Science. 1, 207-234 (2018).
  23. Ideker, T., Galitski, T., Hood, L. A new approach to decoding life: Systems biology. Annual Review of Genomics and Human Genetics. 2, 343-372 (2001).
  24. Barabasi, A. L., Oltvai, Z. N. Network biology: understanding the cell's functional organization. Nature Reviews Genetics. 5, 101-113 (2004).
  25. Tan, H., et al. Integrative proteomics and phosphoproteomics profiling reveals dynamic signaling networks and bioenergetics pathways underlying T cell activation. Immunity. 46, 488-503 (2017).
  26. Bai, B., et al. Deep multilayer brain proteomics identifies molecular networks in alzheimer's disease progression. Neuron. 105, 975-991 (2020).
  27. Zeng, H., et al. Discrete roles and bifurcation of PTEN signaling and mTORC1-mediated anabolic metabolism underlie IL-7-driven B lymphopoiesis. Science Advances. 4, 5701 (2018).
  28. Seyfried, N. T., et al. A multi-network approach identifies protein-specific co-expression in asymptomatic and symptomatic Alzheimer's disease. Cell Systems. 4, 60-72 (2017).
  29. Johnson, E. C. B., et al. Large-scale proteomic analysis of Alzheimer's disease brain and cerebrospinal fluid reveals early changes in energy metabolism associated with microglia and astrocyte activation. Nature Medicine. 26, 769-780 (2020).
  30. Stewart, E., et al. Identification of therapeutic targets in rhabdomyosarcoma through integrated genomic, epigenomic, and proteomic analyses. Cancer Cell. 34, 411-426 (2018).
  31. Rudolph, J. D., Cox, J. A network module for the perseus software for computational proteomics facilitates proteome interaction graph analysis. Journal of Proteome Research. 18, 2052-2064 (2019).
  32. Zhang, B., et al. Proteogenomic characterization of human colon and rectal cancer. Nature. 513, 382 (2014).
  33. Petralia, F., et al. Integrated proteogenomic characterization across major histological types of pediatric brain cancer. Cell. 183, 1962 (2020).
  34. Dutkowski, J., et al. A gene ontology inferred from molecular networks. Nature Biotechnology. 31, 38 (2013).
  35. Yu, M. K., et al. Translation of genotype to phenotype by a hierarchy of cell subsystems. Cell Systems. 2, 77-88 (2016).
  36. Jansen, R., Greenbaum, D., Gerstein, M. Relating whole-genome expression data with protein-protein interactions. Genome Research. 12, 37-46 (2002).
  37. Huttlin, E. L., et al. Architecture of the human interactome defines protein communities and disease networks. Nature. 545, 505-509 (2017).
  38. Ron-Harel, N., et al. Mitochondrial biogenesis and proteome remodeling promote one-carbon metabolism for T cell activation. Cell Metabolism. 24, 104-117 (2016).
  39. Niu, M. M., et al. Extensive peptide fractionation and y(1) ion-based interference detection method for enabling accurate quantification by isobaric labeling and mass spectrometry. Analytical Chemistry. 89, 2956-2963 (2017).
  40. Chang, W. shiny: Web Application Framework for. Nature Protocols. 11, 2301-2319 (2021).
  41. . JUMPn Available from: https://github.com/VanderwallDavid/JUMPn_1.0.0 (2021)
  42. . Anaconda Available from: https://docs.anaconda.com/anaconda/install/ (2021)
  43. . miniconda Available from: https://docs.conda.io/en/latest/miniconda.html (2021)
  44. . RStudio Available from: https://www.rstudio.com/products/rstudio/download/ (2021)
  45. . Shiny Server Available from: https://shiny.rstudio.com/articles/shinyapps.html (2021)
  46. Tyanova, S., Temu, T., Cox, J. The MaxQuant computational platform for mass spectrometry-based shotgun proteomics. Nature Protocol. 11, 2301-2319 (2016).
  47. . R code Available from: https://github.com/VanderwallDavid/JUMPn_1.0.0/tree/main/JUMPn_preprocessing (2021)
  48. Florens, L., et al. Analyzing chromatin remodeling complexes using shotgun proteomics and normalized spectral abundance factors. Methods. 40, 303-311 (2006).
  49. Zhang, B., Horvath, S. A general framework for weighted gene co-expression network analysis. Statistical Applications in Genetics and Molecular Biology. 4, (2005).
  50. Voineagu, I., et al. Transcriptomic analysis of autistic brain reveals convergent molecular pathology. Nature. 474, 380 (2011).
  51. Langfelder, P., Zhang, B., Horvath, S. Defining clusters from a hierarchical cluster tree: the Dynamic Tree Cut package for R. Bioinformatics. 24, 719-720 (2008).
  52. Ravasz, E., Somera, A. L., Mongru, D. A., Oltvai, Z. N., Barabasi, A. L. Hierarchical organization of modularity in metabolic networks. Science. 297, 1551-1555 (2002).
  53. Kuleshov, M. V., et al. Enrichr: a comprehensive gene set enrichment analysis web server 2016 update. Nucleic Acids Research. 44, 90-97 (2016).
  54. Liberzon, A., et al. Molecular signatures database (MSigDB) 3.0. Bioinformatics. 27, 1739-1740 (2011).
  55. . FlyEn rich r Available from: https://maayanlab.cloud/FlyEnrichr/#stats (2021)
  56. . JUMPn GitHub Available from: https://github.com/VanderwallDavid/JUMPn_1.0.0/tree/main/resources/example_fly (2021)
  57. Langfelder, P., Horvath, S. Eigengene networks for studying the relationships between co-expression modules. BMC Systems Biology. 1, 54 (2007).
  58. Benjamini, Y., Hochberg, Y. Controlling the false discovery rate - a practical and powerful approach to multiple testing. Journal of the Royal Statistical Society: Series B. 57, 289-300 (1995).
  59. Szklarczyk, D., et al. STRING v10: protein-protein interaction networks, integrated over the tree of life. Nucleic Acids Research. 43, 447-452 (2015).
  60. Szklarczyk, D., et al. STRING v11: protein-protein association networks with increased coverage, supporting functional discovery in genome-wide experimental datasets. Nucleic Acids Research. 47, 607-613 (2019).
  61. Huttlin, E. L., et al. The BioPlex network: A systematic exploration of the human interactome. Cell. 162, 425-440 (2015).
  62. Huttlin, E. L., et al. Dual proteome-scale networks reveal cell-specific remodeling of the human interactome. Cell. 184, 3022-3040 (2021).
  63. Li, T., et al. A scored human protein-protein interaction network to catalyze genomic interpretation. Nature Methods. 14, 61-64 (2017).
  64. Wang, H., et al. Deep multiomics profiling of brain tumors identifies signaling networks downstream of cancer driver genes. Nature Communications. 10, 3718 (2019).
  65. Gerstein, M. B., et al. Architecture of the human regulatory network derived from ENCODE data. Nature. 489, 91-100 (2012).
  66. Yu, J., Peng, J., Chi, H. Systems immunology: Integrating multi-omics data to infer regulatory networks and hidden drivers of immunity. Current Opinion in Systems Biology. 15, 19-29 (2019).
  67. Califano, A., Alvarez, M. J. The recurrent architecture of tumour initiation, progression and drug sensitivity. Nature Reviews Cancer. 17, 116-130 (2017).
  68. Hein, M. Y., et al. A human interactome in three quantitative dimensions organized by stoichiometries and abundances. Cell. 163, 712-723 (2015).
  69. Liang, Z., Xu, M., Teng, M. K., Niu, L. W. Comparison of protein interaction networks reveals species conservation and divergence. BMC Bioinformatics. 7, 457 (2006).
  70. Shou, C., et al. Measuring the evolutionary rewiring of biological networks. PLOS Computational Biology. 7, 1001050 (2011).
  71. Zhou, Y., et al. Metascape provides a biologist-oriented resource for the analysis of systems-level datasets. Nature Communications. 10, 1523 (2019).
  72. Cline, M. S., et al. Integration of biological networks and gene expression data using Cytoscape. Nature Protocols. 2, 2366-2382 (2007).

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Explore More Articles

176

This article has been published

Video Coming Soon

JoVE Logo

Privacy

Terms of Use

Policies

Research

Education

ABOUT JoVE

Copyright © 2025 MyJoVE Corporation. All rights reserved