פרוטוקול זה מספק הבנה מקיפה של איזופורמים של גנים הנוצרים על ידי שחבור חלופי ופוליאדנילציה על ידי מתן זרימת עבודה שלב אחר שלב לזיהוי אתרי שחבור דיפרנציאליים, אקסונים המבוטאים באופן דיפרנציאלי ואתרי פולי(A). היתרון העיקרי של פרוטוקול זה הוא שהוא מעריך הן שיטות מבוססות אקסון והן שיטות מבוססות אירועים לחקר שחבור חלופי. היא גם מיישמת שיטה מבוססת אקסון לחקר פוליאדנילציה חלופית.
קבצי R Markdown הכוללים את הקודים וההערות עבור ניתוח AS ו- AP סופקו. מומלץ לבצע את השלבים בקובץ R Markdown ולהגיע להערה עבור כל שלב בזהירות. כדי לזהות שחבור דיפרנציאלי באמצעות diffSplice מלימה, עקוב אחר קובץ המחברת R.
הכן את קבצי הקלט כמתואר בכתב היד של הטקסט. ודא ששלבים 1 עד 3 בכתב היד בוצעו ברצף כדי להכין קבצי קלט לפני שתמשיך הלאה. התחל על ידי טעינת הספריות הדרושות.
כדי לבצע סינון לא ספציפי, תחילה חלץ את מטריצת ספירות הקריאה שהתקבלו בעבר וצור רשימה של תכונות באמצעות הפונקציה DGEList מחבילת edgeR, שבה שורות מייצגות גנים ועמודות מייצגות דגימות. לאחר מכן, הפוך את הנתונים מקנה מידה גולמי לספירה למיליון באמצעות הפונקציה CPM מחבילת edgeR, ושמור על אקסונים עם ספירות הגדולות מסף הניתן להגדרה. ערכת נתונים זו מכילה שש דוגמאות.
לפיכך, ה-CPM נקבע על יותר מדגימה אחת ולפחות שלוש דגימות מתוך שש. נרמל את הספירות בין דגימות באמצעות הפונקציה calcNormFactors מחבילת edgeR באמצעות ממוצע חתוך של ערכי M. פונקציה זו תחשב גורמי קנה מידה כדי להתאים את גודל הספרייה.
השתמש בטבלת הדוגמאות שנוצרה בעבר כדי ליצור את מטריצת העיצוב כדי להגדיר את תנאי הניסוי עבור כל דגימה. הפעל את פונקציית voom של חבילת לימה כדי לעבד נתוני ריצוף RNA כדי להעריך את השונות. פונקציה זו תיצור משקלים מדויקים לתיקון רעשי ספירת פואסון ותהפוך את ספירות רמת האקסון לרישום שתי ספירות למיליון או logCPM.
הפעל את פונקציית lmfit כדי להתאים מודלים ליניאריים לנתוני הביטוי עבור כל אקסון. לאחר מכן הפעל את פונקציית eBayes כדי לחשב סטטיסטיקה מבוססת אמפירית עבור המודל המותאם כדי לזהות ביטוי אקסון דיפרנציאלי. הגדר מטריצת ניגודיות להשוואות הניסוייות המעניינות.
השתמש בניגודים. פונקציית התאמה לקבלת מקדמים ושגיאות תקן עבור כל זוג השוואות. הפעל diffSplice על המודל המותאם כדי לבחון את ההבדלים בשימוש אקסון של גנים בין סוג פראי נוקאאוט.
חקור את התוצאות המדורגות ביותר באמצעות פונקציית topSplice שבה בדיקה השווה ל- t נותנת דירוג של אקסונים של AS ובדיקה השווה לסימס נותנת דירוג של גנים. הפעל את הפונקציה plotSplice כדי להתוות את התוצאות. כאשר מכניסים את הגן המעניין לטיעון מזהה הגן, הנקודות האדומות מציגות את האקסונים המבוטאים באופן דיפרנציאלי.
צור חלקת הר געש באמצעות חבילת המוליכים הביולוגיים EnhancedVolcano כדי להציג את האקסונים המבוטאים באופן דיפרנציאלי. כדי להשתמש ב- rMATS, ודא שהגרסה העדכנית ביותר של rMATS גירסה 4.1.1 מותקנת באמצעות conda או GitHub בספריית העבודה. עבור אל התיקיה המכילה קבצי bam שהתקבלו לאחר המיפוי.
הכן קבצי טקסט כנדרש על-ידי rMATS עבור שני התנאים של העתקת השם של קבצי bam והנתיב שלהם מופרדים על ידי פסיק. הפעל rmas. py באמצעות שני קבצי טקסט קלט שנוצרו המתארים את הנתיב של קבצי BAM ואת הביאור.
קובץ GTF שהושג בעבר. פעולה זו יוצרת תיקיית פלט rmats_out המכילה קבצי טקסט המתארים נתונים סטטיסטיים הכוללים ערכי P ורמות הכללה עבור כל אירוע שחבור בנפרד. השתמש במזר חבילת המוליכים הביולוגיים כדי לחקור את תוצאות rMATS.
טען את הצומת ואקסון סופר קבצי טקסט עם הסיומת JCEC לתוך אובייקט maser וכלול לפחות חמש קריאות ממוצעות לכל אירוע שחבור כדי לסנן את התוצאה בהתבסס על כיסוי. כדי להמחיש את תוצאות ה- rMATS, הפעל תחילה את הפונקציה topEvents מחבילת המזר, ובחר את אירועי השחבור המשמעותיים בשיעור גילוי כוזב של 10% ושינוי מינימלי של 10% באחוזים שחבורים ב- או PSI. בדוק את אירועי הגן עבור גנים בודדים בעלי עניין והתווה ערכי PSI עבור כל אירוע שחבור של אותו גן.
צור תרשים הר געש על-ידי ציון סוג האירוע. השתמש בתוצאות אירועי השחבור המתקבלות עם rMATS בצורה של קבצי טקסט כדי ליצור עלילות סשימי באמצעות חבילת rmats2sashimiplot. עלילת הסשימי מציגה אירוע אקסון מדלג בגן Wnk1.
כל שורה מייצגת דגימת RNA-seq, שלושה שכפולים מסוג פראי ונוקאאוט Mbnl1. הגובה מראה כיסוי קריאה ב- RPKM והקשתות המחברות מתארות קריאות צומת על פני אקסונים. החלק התחתון מציג איזופורמים חלופיים של מודל גנים מבואר.
ניתן לראות שינוי משמעותי בקיפול וראיות סטטיסטיות חזקות להבדלים אמיתיים בגנים הממוקמים ברבעים השמאליים או הימניים העליונים של חלקות הר הגעש המתקבלות באמצעות diffSplice ו- DEXSeq. אקסון קסטה נמצא משתנה בין תנאים שונים עבור הגן Wnk1. חלקת השימוש באקסון דיפרנציאלי הראתה עדויות לשחבור דיפרנציאלי בחמישה אתרי אקסון ליד Wnk1.6.45, כאשר האקסונים המודגשים בוורוד עשויים להיות משודכים בדגימות נוקאאוט Mbnl1 בהשוואה לסוג פראי.
חלקת הר הגעש של גנים שחבורים לחלופין סייעה להבחין בין הגנים שלא נכללו בסוג הבר לבין אלה שנכללו בסוג הבר. סוגי אירועי השחבור SE, A5SS, A3SS, MXE ו-RI הודגמו באמצעות חלקות סשימי של הגנים המשמעותיים ביותר של אותם אירועים. פעילות ה-APA הדיפרנציאלית בשלושה אזורים ראשוניים לא מתורגמים של גנים נצפתה באמצעות חלקות הר געש.
תוצאות השימוש באתר הרשות הפלסטינית, בעלות ההפרש המשמעותי, שנרכשו מצינורות שונים, הוצגו באמצעות עלילת אירוע. ניתן לראות תזוזה דיסטלית משמעותית עד פרוקסימלית של השימוש באתר PA בנוקאאוטים כפולים בשני הגנים FOSL1 ו- Papola. הכיסוי הממוצע באזורי אגף המעוגנים באתרי ביקוע ידועים של הרשות הפלסטינית ברמה הגנומית כולה נקבע באמצעות חלקת אבחון.
ודא שהפרמטרים כגון מידע טרנס-ספציפי ומאפשרים חפיפה מרובה משמשים כראוי בעת יצירת מדדי ספירה. התאמת מודל ליניארי ויצירת זוגות ניגודיות חשובים להשוואה נכונה. עבור rMATS, ודא שכל הפרמטרים מוגדרים כראוי בהתאם לנתונים שלך לפני הפעלת הפקודה.
הגנים המתקבלים מפעילות שחבור דיפרנציאלית יכולים לשמש לביצוע ניתוח העשרת סט גנים. כלי נוסף בשם MISO יכול לשמש לניתוח נוסף מבוסס אירועים.