Method Article
OpenProt הוא מסד נתונים ונגיש באופן חופשי אוכף דגם polycistronic של הגנום האיקריוטים. כאן, אנו מציגים פרוטוקול לשימוש של מסדי נתונים OpenProt כשחוקרים datasets ספקטרומטר מסה. שימוש OpenProt מסד נתונים לניתוח של ניסויים פרוטיאומיה מבנית מאפשרת גילוי של הרומן וחלבונים בעבר לגילוי.
ביאור הגנום הוא מרכזי מחקר פרוטיאומיה מבנית של היום כמו זה מצייר את קווי המתאר של הנוף פרוטיאומיה מבנית. מודלים מסורתיים של פתח קריאה מסגרת (ORF) ביאור לכפות קריטריונים שרירותיים שני: אורך מינימלי של 100 codons, של ORF יחיד לפי התעתיק. עם זאת, מספר גדל והולך של מחקרים מדווחים ביטוי של חלבונים מן לכאורה ללא קידוד אזורים, מאתגר את הדיוק של ביאורים הגנום הנוכחי. אלה הרומן חלבונים נמצאו מקודדים או בתוך ללא קידוד RNAs, 5 או 3' לא מתורגם מחוזות (UTRs) mRNAs, או חופפים רצף קידוד ידוע (תקליטורים) בחלופה ORF. OpenProt הוא הראשון מסד הנתונים אוכף למודל polycistronic האיקריוטים הגנום, ומאפשר ביאור של ORFs מרובים עבור כל פרוטוקול. OpenProt נגישה בחופשיות, ומציע הורדות המותאם אישית של רצפי חלבונים על פני 10 מינים. שימוש OpenProt מסד נתונים לניסויים פרוטיאומיה מבנית מאפשר גילוי הרומן חלבונים ושל מדגיש את האופי polycistronic של גנים האיקריוטים. גודל מסד OpenProt (כל חזה חלבונים) הוא משמעותי, צריך להילקח בחשבון לניתוח. עם זאת, עם גילוי שקר המתאים (פד) בהגדרות או השימוש של מסד נתונים OpenProt מוגבלת, משתמשים ירוויח תצוגה ריאליסטית יותר של הנוף פרוטיאומיה מבנית. בסך הכל, OpenProt הוא כלי זמין באופן חופשי כי תשקוד תגליות פרוטיאומיה מבנית.
במהלך העשורים האחרונים, הפך פרוטאומיקס ספקטרומטר מסה (נולד ב- MS) המבוסס על הטכניקה הזהב לפענח proteomes של התאים האיקריוטים1,2,3,4,5. שיטה זו מתבססת על ביאורי הגנום הנוכחי כדי ליצור הפניה חלבון רצף מסד נתונים אשר מתווה את טווח האפשרויות-6,-7,-8. עם זאת, ביאורים הגנום החזק קריטריונים שרירותיים על ביאור ORF, כגון אורך מינימלי של 100 codons, של ORF יחיד לפי התעתיק9,10. מספר גדל והולך של מחקרים אתגר המודל הנוכחי ביאור ולדווח על גילויים של unannotated ORFs תפקודי הגנום האיקריוטים8,11,12,13, 14. אלו חלבונים הרומן מצויים לקודד לכאורה אי קידוד RNAs, 5 או 3' ללא תרגום אזורים (UTR) של mRNAs, או חופפים את רצף קידוד קאנוני (cCDS) במסגרת חלופית. אמנם רוב התגליות האלה כבר התגלה באקראי, הם מדגימים את האזהרות של ביאורים הגנום הנוכחי ואת אופי polycistronic של גנים האיקריוטים8.
כאן, אנחנו מדגישים את השימוש OpenProt מסדי נתונים מבוססי MS פרוטאומיקס. OpenProt הוא מסד הנתונים הראשון לקיים מודל ביאור polycistronic transcriptomes האיקריוטים. זה זמין באופן חופשי בגיל www.openprot.org15. שיעור של אלה חזה ש-orfs יהיה אקראי ולא שאינם פונקציונליים, וזו הסיבה OpenProt cumulates ראיות ניסיוני ופונקציונליים כדי להגדיל את הביטחון העצמי. ראיות כוללים ביטוי חלבון (על-ידי MS) תרגום ראיות (על-ידי יצירת פרופיל ריבוזום)15. ראיה פונקציונלי כוללים הומולוגיה חלבון (עם בפרנואידית כמו גישה), תחום פונקציונלי חיזוי15.
OpenProt מציעה את האפשרות להוריד מספר מסדי נתונים, המכיל רק הנתמכים היטב חלבונים למסדי נתונים בהזמנה אישית. כאן, נציג צינור לשימוש של מסדי נתונים OpenProt, יציע תובנות מאיזה מסד נתונים כדי לבחור בהתחשב המטרה ניסיוני. הצינור ניתוח פרוטאומיקס, המובאת כאן נתמך על ידי המסגרת גלקסי גישה פתוחה, קל לשימוש, אבל מאגרי המידע יכול לעבוד עם כל זרימת עבודה16,17,18. גם נציג כיצד להשתמש באתר האינטרנט של OpenProt עבור איסוף מידע נוסף על הרומן חלבונים זוהה על ידי גב' שימוש OpenProt מסדי נתונים מספקת תצוגה מקיפה יותר של הנוף פרוטיאומיה מבנית, תשקוד מהתגליות פרוטאומיקס, סמנים ביולוגיים דרך שיטתית יותר מאשר שיטות הנוכחי.
פרוטוקול זה מדגיש את השימוש OpenProt מסדי נתונים15 כשחוקרים MS datasets; זה לא יבדוק את העיצוב של הניסוי עצמו, אשר כבר ביסודיות שנסקרו במקום20,21,22. במאמץ להישאר פתוח לחלוטין, הפרוטוקול הוא זמין באופן חופשי (S1 חומר משלים–S4). לקריאה קלה יותר, כל המונחים OpenProt וברחבי בזאת פרוטוקול זה מוגדרים בטבלה1.
1. OpenProt מסד נתונים להורדה
הערה: מסדי נתונים מותאמים אישית המבוססים על נתוני ה-RNA-seq לדוגמה ניתן להשיג, ההליך מפורט בסעיף השני של פרוטוקול זה. אם יש צורך במסד נתונים מותאמים אישית, אנא דלג לסעיף הבא.
2. מותאם אישית OpenProt מסד נתונים להורדה
הערה: סעיף זה מפרט כיצד להשיג מסד נתונים מותאמים אישית. אם אין נתונים מותאם אישית נדרשת, דלג לסעיף הבא.
3. מאגר טיפול
הערה: מעכשיו, פלטפורמת גלקסי ישמש, אך ניתן להחיל אותם עקרונות לתוכנות אחרות פרוטיאומיה מבנית.
4. הכנת קובץ ספקטרומטר מסה
הערה: רוב הכלים פרוטאומיקס הזמינים על גלקסי מופעים להשתמש בתבנית mzML, ומעדיפים פפטיד מנועי חיפוש נתונים במצב centroid.
5. פפטיד וחלבון זיהוי/כמת
הערה: חלק זה של הצינור משתמשת בכלים של הסוויטה OpenMS, תכליתי ומסגרת נוחה לשימוש18.
6. בקרת איכות
הערה: מכיוון פרוטאומיקס מבוססי MS הוא התוצאה של תהליך מורכב שבו כל שלב צריך להיות מותאם כדי להפיק תוצאות לשחזור, בקרת איכות היא הליך הכרחי ב ה33של זרימת העבודה.
7. OpenProt מסד נתונים הכרייה
הערה: לאחר ביצוע מזהה בטוחים של חלבון הרומן שמנבאת OpenProt (ההצטרפות מספרים החל IP_ עבור AltProts ו- II_ עבור הרומן איזופורמים), מידע ביולוגי נוסף יכול להיות שנאספו של אתר האינטרנט OpenProt15.
זרימת העבודה המתוארת לעיל הוחל על dataset MS זמינים ב38,מאגר גאווה39. המחקר המקורית שפותחה שיטה (iMixPro), באמצעות איזוטופ יציב תיוג של חומצות אמינו בתרבות תא (SILAC), כדי למנוע תוצאות חיוביות שגויות של זיקה לטיהור MS (AP-MS) ניסויים38. בקצרה, ניסוי AP-MS מורכב באמצעות נוגדנים חרוזים-מחויב להביא חלבון של עניין (פיתיון) interactors שלו (הטרף). החלבונים שנאספו לאחר מכן מתעכל, שהוכנו עבור MS. שיטת הכנה מדגם ואת הגדרות מכשיר, מתוארים במחקר המקורי ועל המאגר גאווה (PXD004246). אתגר בניסויים כאלה היא השפע של תוצאות חיוביות שגויות, בעיקר של חלבונים מחייב את החרוזים. אבל לא את הפיתיון. כאן השתמשנו SILAC כדי ליצור יחסי איזוטופ לבין הטרף נכון תוצאות חיוביות שגויות: 3 שליטה (אין פיתיון) תרבותי אור בינוני, 1 מדגם לבטא את הפיתיון תרבותי אור בינוני ו 1 מדגם לבטא את הפיתיון תרבותי בינוני כבד הדגימות עיבוד עם חרוזים, ספקטרומטר מסה ניתוח נוסף. עם עיצוב כזה, חלבונים שאינם ספציפיים מחייב את החרוזים תהיה של כבדות לאור יחס של 1:4; כאשר הטרף נכון יהיה יחס של 1:138.
מחדש ניתחנו את הנתונים שלהם-AP-MS משימוש במסד הנתונים OpenProt; הדיג בסירות האלה כללו שלושה חלבונים אנדוגני (PTPN14, JIP3 ו- IQGAP1), שניים יתר באה לידי ביטוי חלבונים (RAF1 ו- RNF41). מאז הניסויים להשתמש SILAC, היה להשתמש בזרימת העבודה של גלקסיה על כימות חלבון (S3 חומר משלים, איור 2). זרימת העבודה היה להפעיל אותו באמצעות מסד הנתונים OpenProt שלמה (OpenProt_all) או מסד נתונים OpenProt מוגבלת (OpenProt_2pep, כולל רק חלבונים מזוהה בעבר עם מינימום של שני פפטידים ייחודי).
חלבון וכימות היו טובים, לשחזור מעבר בשימוש מסדי הנתונים שונים. כפי שמוצג באיור3, רוב החלבונים מזוהה בעיתון המקורי אותרו גם באמצעות מסד הנתונים ' OpenProt_2pep ' או ' OpenProt_all (רשימה מפורטת זמינה ב- S5 חומר משלים). תוצאה זו מראה כי הצינור המתוארים כאן את OpenProt מסדי נתונים מסוגלים לייצר חלבון וכימות לזו של נהלים הנוכחי מבוסס על מסדי נתונים UniProtKB40. עם זאת, השימוש של מסדי נתונים OpenProt יש יתרון ייחודי המאפשר זיהוי של הרומן וחלבונים לגילוי בעבר, כפי שמתואר במקרה זה ללמוד.
11 הנתמכים היטב חלבונים (1 Isoform ו- 10 AltProts), אך כיום לא מוערת של מסדי נתונים, זוהו על-פני כל נתונים (datasets), עם פפטידים בטוח בעצמו, באמצעות מסד הנתונים OpenProt_2pep (כל חלבון accessions, לצד מספר התומכים פפטידים, זמינות S5 חומר משלים). מסד נתונים זה מאפשר השימוש של 1% מסורתיים רוזוולט כמו הגדלת מרחב החיפוש נשאר מתונה. אלו חלבונים 11 לא זוהו במחקר המקורי כפי שהם נעדרו ממסד הנתונים.
חלבונים הרומן 29 (איזופורמים 16 ו- 13 AltProts) התגלו לאורך כל נתונים (datasets), עם פפטידים בטוח בעצמו, באמצעות מסד הנתונים OpenProt_all (כל חלבון accessions, יחד עם המספר של תמיכה פפטידים, הן S6 חומר משלים הזמינות ב- ). כפי שמוצג באיור3, פד מחמירים מומלץ לא השפיעה ההזדהויות הכי בטוחה של חלבון, למרות שזה להקטין את המספר הכולל של חלבונים מזוהה. יחסית למסד הנתונים OpenProt_2pep ', מספר גבוה יותר של חלבונים רומן יכול להיות בביטחון מזוהה. כל החלבונים האלה הרומן נעדרים ממסד הנתונים של OpenProt_2pep. זה מדגיש את תפקיד מכריע של מסד הנתונים שבחרת עבור פרוטאומיקס מבוססי MS.
חלבון רומן אחד התגלה interactor של החלבון RAF1 (IP_637643). באמצעות אתר האינטרנט OpenProt, ניתן לראות חלבון זה לא זוהו על ידי MS ולא ריבוזום פרופיל עד עכשיו (גירסה 1.3 OpenProt). החלבון חומצות אמינו 46 ארוך, יכול לתת רק שני פפטידים ייחודי על עיכול tryptic. פפטיד שזוהו ב RAF1 AP-MS dataset (שבר 18) היה קשת באיכות טובה, כפי שמוצג באיור4, ומוצגים כבדות לאור יחס של 1,09. החלבון מקודד בגן NANOGNBP1 , אשר הוא פסאודוגן של NANOGNB. התמליל (ENST00000448444), כיום מבואר כמו ללא קידוד, זוהה על-פני מספר רקמות לפי פורטל GTEx40. החלבון מכיל תחום פונקציונלי חזויים הקשורים עם דנ א איגוד (ג'ין אונטולוגיה קדימה: 0003677)41.
איור 1 : מסד נתונים לבחירה עבור תרשים ניתוחים פרוטאומיקס. ניתוח של נתונים MS, ובייחוד את הבחירה של מסד הנתונים, תלויים מטרות המחקר. שלוש מטרות משותפות יוקפו בקו כחול (צינור קלאסי פרוטיאומיה מבנית), ירוק (חיפוש ממצה פרוטיאומיה מבנית) וכתום (גילוי פרוטיאומיה מבנית). כל המטרה תלויה מאגר מידע מתאים צינור. כלי זיהוי יחיד עשוי לשמש פרוטאומיקס ממצה המסיביות צינורות. עבור צינור גילוי פרוטיאומיה מבנית, אנו ממליצים באמצעות מספר זיהוי מנועי. FDRs מומלצים מסומנים באדום, חלבון מסד נתונים גדלים מסומנים בתיבות אפורות. אנא לחץ כאן כדי להציג גירסה גדולה יותר של הדמות הזאת.
איור 2 : ייצוג גרפי של זרימת העבודה גלקסי להשתמש. ייצוג שזרימת ניתוח פרוטיאומיה מבנית המשמש re-אנליזה של נתונים Eyckerman et al.38שלב אחר שלב. קבצי קלט, פפטיד search וחלבון כימות מסומנים באמצעות תיבות תפוזים. הקופסאות הכחולות מתאימות הכלים בעזרתם, תיבות אפורים שיתאימו קבצי הפלט הנוצר. מנועי חיפוש שונים (MS-GF + ו- X! Tandem) מסומנים באמצעות צבעים שונים (בהתאמה אדום וסגול), כמו גם של חיצים המציינים הכרחי התשומות והתפוקות שלהם. הקופסא הירוקה מדגיש את הכלי יצירת רשימה של חלבון ופיזיקליים. כאשר יציאות מרובות נוצרות, זו ששימשה צעדים במורד הזרם מסומן בתור הקרוב ביותר על החץ. זרימת עבודה זו זמינה בחופשיות S2 חומר משלים. ה-X! קובץ התצורה של פרמטרים ברירת המחדל טנדם זמין S4 חומר משלים. אנא לחץ כאן כדי להציג גירסה גדולה יותר של הדמות הזאת.
איור 3 : השוואה של זיהוי אינטראקטור לכל פיתיון באמצעות מסדי נתונים שונים- דיאגרמות חיתוך קבוצות של חלבון ההזדהויות באמצעות את OpenProt הכי בטוחה מסד (בכתום, תומכים עדות מינימום 2 פפטידים ייחודי, OpenProt_2pep) עם ה 1% פד, או את OpenProt כל מסד הנתונים (בכחול, OpenProt_all) עם 0.001%, רוזוולט, או כפי שדווח המקורי נייר (באפור)38. כל דיאגרמה מקביל interactors מזוהה בשביל הפיתיון שהוזכרו: RAF1, RNF41, PTPN14, JIP3 ו- IQGAP1. אנא לחץ כאן כדי להציג גירסה גדולה יותר של הדמות הזאת.
איור 4 : MS/MS הספקטרום של מזוהה MDNLWAK(13C 6) פפטיד מחלבון הרומן IP_637643. העוצמה היא יחסית (0 ל- 100%). פסגות שנבחרו מסומנות באדום, y יונים הביאורים מופיעים בכהה אדום ו- b יונים ביאורים בירוק. מופק התוכנה TOPPview34. קודמן שגיאה = 2.70 ppm, עידוד ציון = 0.12. אנא לחץ כאן כדי להציג גירסה גדולה יותר של הדמות הזאת.
המונח | הגדרה | הפניה |
ORF חלופי (AltORF) | ORF קאנונית שכרגע אין מוערת של הגנום ביאורים, אך מבואר ב- OpenProt. | 15 |
הפניה ORF (RefORF) | ORF הקנוני מבואר הגנום ביאורים ו OpenProt. | 15 |
חלבון חלופי (AltProt) | חלבון הרומן בקוד על-ידי AltORF, עם אין דמיון משמעותי עם RefProt. ההצטרפות קידומת: IP_. | 15 |
הפניה חלבון (RefProt) | חלבון כעת מבואר חלבון רצף במסדי נתונים כגון UniProtKB, Ensembl או NCBI RefSeq, וגם ב- OpenProt. | 15 |
Isoform רומן | חלבון הרומן בקוד על-ידי AltORF, עם דמיון משמעותי עם RefProt. ההצטרפות קידומת: II_. | 15 |
מסד OpenProt_2pep | מכיל את הרצף של כל RefProts וחלבונים הרומן שמנבאת OpenProt, כבר זיהתה עם מינימום של 2 פפטידים ייחודי. | 15 |
מסד OpenProt_1pep | מכיל את הרצף של כל RefProts וחלבונים הרומן שמנבאת OpenProt, כבר זיהתה עם מינימום של 1 פפטיד ייחודי. | 15 |
מסד OpenProt_all | מכיל את הרצף של כל RefProts וחלבונים הרומן חזה על-ידי OpenProt. | 15 |
טבלה 1: הגדרת המונחים OpenProt וברחבי פרוטוקול
S1 חומר משלים: גלקסי זרימת עבודה עבור מסד הנתונים טיפול. זה יצרף את רצפי CRAPome ואת דמה (הפוכה) קלט במסד הנתונים. הפלט הוא קובץ Fasta. אנא לחץ כאן כדי להוריד.
S2 חומר משלים: גלקסי זרימת עבודה עבור זיהוי חלבונים. זה יהיה לזהות חלבונים מקובץ נתונים ספקטרומטר מסה בעזרת שני מנועי החיפוש (MS-GF + ו- X! טנדם). לכל פרמטר ניתן לכוונן לפי הצורך לפני הפעלת זרימת העבודה. אנא לחץ כאן כדי להוריד.
S3 חומר משלים: גלקסי זרימת עבודה עבור כימות חלבון באמצעות איזוטופ יציב תיוג (סיל). זה לזהות ולכמת חלבונים מקובץ נתונים ספקטרומטר מסה בעזרת שני מנועי החיפוש (MS-GF + ו- X! טנדם). לכל פרמטר ניתן לכוונן לפי הצורך לפני הפעלת זרימת העבודה. אנא לחץ כאן כדי להוריד.
S4 גשמי משלים: X! קובץ התצורה של פרמטרים ברירת מחדל טנדם. קובץ XML זה הכרחי להפעלת ה-X! כלי TandemAdapter על פלטפורמת גלקסי. אנא לחץ כאן כדי להוריד.
S5 חומר משלים: לכמת מהחלבונים iMixPro datasets. קבצי נתונים מ- Eyckerman et al. 201638 עובדו באמצעות מאגרי מידע OpenProt, חלבונים כימות מפורטים עבור כל תנאי. פיתיונות הם PTPN14, JIP3, IQGAP1, RAF1 ו- RNF41. ג'ין המצוין ירוק תואמים חלבונים זיהה גם הנייר המקורי38. שמות ג'ין המצוין כתום מקבילים הידועים interactors על פי BioGrid זה לא דווח בעיתון המקורי. שמות ג'ין המצוין כחול בהיר יתאימו חלבונים הרומן המזוהה כ- interactors (המספר המתאים של ההצטרפות חלבון מותווה בסוגריים). ג'ין שמות המצוין אפור בהיר, נטוי שיתאימו סביר מזהמים (קרטין חלבונים). אנא לחץ כאן כדי להוריד.
S6 חומר משלים: זיהה מהחלבונים הרומן iMixPro datasets. קבצי נתונים מ- Eyckerman et al. 201638 עובדו באמצעות מאגרי מידע OpenProt, חלבונים מזוהה הרומן מפורטים עבור כל תנאי. פיתיונות הם PTPN14, JIP3, IQGAP1, RAF1 ו- RNF41. חלבון ההצטרפות מספרים מפורטים, מתחיל עם II_ עבור הרומן איזופורמים של חלבון ידוע, ועם IP_ עבור מהחלבונים הרומן ORF חלופי (AltProt). המספר של תמיכה פפטידים מסומנים בסוגריים מרובעים. אנא לחץ כאן כדי להוריד.
בעת ניתוח נתוני ספקטרומטרים המוני, האיכות של זיהוי חלבונים חלקית מסתמך על הדיוק של מסד נתונים בשימוש6,20. לגישות באופן מסורתי משתמשים במסדי נתונים UniProtKB, אך אלה תומכות בדגם ביאור הגנום ORF יחיד לפי התעתיק ואורך מינימלי של codons (למעט דוגמאות הפגינו בעבר) 10040. מחקרים רבים מתייחסים את החסרונות של מסדי נתונים כאלה עם גילוי ORFs תפקודית של לכאורה ללא קידוד אזורים8,11,12,13. עכשיו, OpenProt מאפשר זיהוי חלבונים ממצה יותר כמו זה מושך רצפי חלבונים מביאורים transcriptome מרובים. OpenProt מאחזר NCBI RefSeq (GRCh38.p7), Ensembl (GRCh38.83) transcriptomes וביאורים UniProtKB (UniProtKB-SwissProt, 2017-09-27)40,42,43. ביאורים הנוכחי להציג חפיפה מועטה, OpenProt ובכך מציג תצוגה יותר ממצה של הנוף פרוטיאומיה מבנית פוטנציאליים מאשר כאשר מוגבל אחד ביאור15.
יתר על כן, כפי OpenProt אוכף מודל polycistronic, היא מאפשרת מספר ביאורים חלבון לפי התעתיק. מסיבות סטטיסטיות וחישובית, OpenProt עדיין מחזיקה את הסף אורך מינימלי של 30 codons15. ובכל זאת, זה מנבא אלפי רצפי חלבונים הרומן, ובכך להרחיב את טווח אפשרויות לזיהוי החלבון. מתוך תפיסה זו, OpenProt תומך פרוטיאומיה מבנית תגליות בצורה שיטתית יותר.
האיכות של זיהוי חלבונים עשויה להיות מושפעת גם הפרמטרים המשמשים. ניתוחים פרוטאומיקס מבוססי MS כלל מחזיקים חלבון 1% פד. עם זאת, OpenProt בכל מסד הנתונים מכיל בערך פי 6 יותר ערכים (איור 1). לקחת בחשבון גידול משמעותי זה לחלל, אנו ממליצים על שימוש של רוזוולט מחמירים יותר של 0.001%. פרמטר זה היה ממוטב באמצעות בחינת מחקרים והערכת ידנית ספקטרה שנבחרו באקראי15. חיובי כוזב הם עדיין אפשרות, אבל, אנו מעודדים את אימות לתמוך ראיות על חלבון הרומן, בדיקה יסודית. תקן מומלץ יכול להיות הזיהוי של חלבון מ MS שתי הפעלות שונות, כמו נתוני רקע תוצאות חיוביות שגויות משתנות בין נתונים (datasets)15.
הצינור שסופק כאן ונועד לשמש מקרה המבחן יכול להיות שונה מרוצה להתאים את עיצוב ניסיוני והפרמטרים. אנו ממליצים באמצעות מספר מנועי חיפוש, שכן היא מגבירה את הרגישות ורגישות של פפטיד זיהוי32. יתר על כן, אנו מעודדים שימוש במסד הנתונים המתאימים ביותר המטרה ניסיוני (איור 1). בתור משתמש את OpenProt כל מסד הנתונים מגיע עם פד המחמירים, ייתכן ההזדהויות אמיתי. לפיכך, במסד הנתונים כולו צריך להיות מיועד גילוי הרומן חלבונים, בעוד פרוטאומיקס קלאסית פרופיל להשתמש במאגרי המידע OpenProt קטנים יותר (כגון OpenProt_2pep השתמשו במחקר במקרה לעיל).
OpenProt כרגע המנבא רצפים החל codon ATG, ואילו מספר מחקרים מודגשות תרגום חניכה בגיל44,אחרים codons45. כאשר חלבון הרומן מזוהה על ידי פפטידים ייחודי אחד או כמה, זה אפשרי ש-codon חניכה נכון אינה ATG המשוער. המשתמשים יכולים לחפש הוכחות תרגום באתר האינטרנט של OpenProt. כיום, OpenProt רק דוחות תרגום אירועים אם הן נוגעות כל חלבון החזוי רצף (100% חפיפה)15. לפיכך, היעדר ראיות תרגום לא אומר שהחלבון לא מתורגם, אבל זה codon התחלה לא ייתכן ATG לכאורה.
למרות מגבלותיה הנוכחי, OpenProt מציע נוף יותר ממצה של פוטנציאל קידוד של הגנום האיקריוטים. OpenProt מסדי נתונים פוסטר פרוטיאומיה מבנית תגליות וההבנה של פונקציות פרוטיאומיה מבנית ואינטראקציות. התפתחויות עתידיות של מסד הנתונים OpenProt יכלול ביאור של מינים אחרים, תרגום עדויות בלתי-ATG להתחיל codon ופיתוח של צינור כדי לכלול חלבונים הרומן הגנום כולו ולימודים רצף exome.
המחברים מצהירים ללא ניגוד אינטרסים.
אנו מודים ויויאן Delcourt על עזרה, דיונים ועצה על העבודה. X.R. הוא חבר של דו הנתמכות על-ידי קוויבק Santé FRQS דה מרכז רשרש du Fonds דה רשרש מרכז שרברוק דה Universitaire Hospitalier. מחקר זה נתמך על ידי כיסא קנדה מחקר פרוטאומיקס פונקציונלי, גילוי של הרומן חלבונים גרנט X.R. ו- CIHR מגב-137056. אנו מודים הקבוצה לחשב את ה קוויבק, קנדה מחשוב לתמיכה שלהם עם השימוש mp2 מחשב העל של אוניברסיטת דה שרברוק. הפעולה של מחשב העל mp2 ממומנת על ידי קנדה קרן של חדשנות (CFI), le ministère de l'Économie, דה לה המדע et du l'innovation דה קוויבק (MESI) ו les Fonds דה קוויבק רשרש - טבע et טכנולוגיות (FRQ-NT). שרת ה-Galaxy שבו נעשה שימוש עבור כמה חישובים פרוטאומיקס בחלקו ממומן על ידי שיתופי מחקר מרכז 992 אפיגנטיקה רפואי (DFG גרנט SFB 992/1/2012), הגרמני הפדרלי במשרד החינוך והמחקר (BMBF מעניק 031 RBC A538A/A538C, 031L0101B /031L0101C de. אי-אפינפרין, דה 0106 031L. מדרגות (de. אי)).
Name | Company | Catalog Number | Comments |
OpenProt website | open source | n/a | www.openprot.org |
Galaxy Server | open source | n/a | https://usegalaxy.eu/ |
TOPPview software | open source | n/a | www.openms.de |
Request permission to reuse the text or figures of this JoVE article
Request PermissionThis article has been published
Video Coming Soon
Copyright © 2025 MyJoVE Corporation. All rights reserved