ברוכים הבאים לפרוטוקול של ניתוח תמלול תפוקה גבוהה לחקירת אינטראקציות מארח-פתוגן. פרוטוקול זה מחולק בשלבים הבאים. בקרת איכות לסינון קריאות באיכות נמוכה וגם להסרת רצפי מתאם רצף וביאורים, היכן עליך למפות את הקריאות לגנומי ייחוס ולהכניס את הקריאות לגנים.
ניתוח סטטיסטי וביטוי משותף, המגדיר את הגנים המבוטאים באופן דיפרנציאלי ומוצא גם את מודולי הביטוי המשותף. דרגה מולקולרית של ניתוח שיבוש כדי למצוא דגימות חריגות פוטנציאליות. ולבסוף, הניתוח התפקודי כדי לקבוע את הפונקציות הביולוגיות של גנים מבוטאים באופן דיפרנציאלי.
כל הכלים המשתמשים בצנרתות אלה הותקנו מראש במערכת לינוקס ונאספו לתוך מיכל Docker. הדגימות המשתמשות בפרוטוקולים אלה נגזרות ממאמר שפורסם על ידי הקבוצה שלנו בפתוגן PLOS. הדגימות כוללות 20 אנשים בריאים ו -39 חולים נגועים בנגיף Chikungunya.
דגימות הדם נאספו, ורצף RNA בוצע. כדי להתקין את Docker במערכת Windows, עליך לבצע שלבים אלה. עבור אל דף האינטרנט הרשמי של Docker ולחץ על התחל בעבודה.
מצא את המתקין עבור שולחן העבודה של Docker עבור חלונות. הורד את הקובץ. התקן באופן מקומי במחשב שלך.
ודא ששתי אפשרויות אלה מסומנות. לאחר התקנת התוכנית, מוריד את התמונה Docker עבור פרוטוקול זה. עבור אל מסוף Windows.
בצע את הפקודות כדי להוריד את התמונה. לאחר הורדת התמונה, אתה יכול לראות את הקובץ בשולחן העבודה Docker, ומתמונת זו, אנו יכולים ליזום את הגורם המכיל. לאחר שתלחץ על הלחצן העגול, עליך להרחיב את הפרמטרים והאפשרויות המקוריים כדי להגדיר את שם הגורם המכיל ולשייך תיקיה במחשב המקומי שלך לתיקיה בתוך Docker.
לאחר מכן, לחץ על הפעל כדי לאתחל את הגורם המכיל. לאחר מכן תוכל לגשת למסוף, שנמצא במערכת לינוקס בתוך Docker. הקלד את פקודות bash ולאחר מכן באפשרותך לבצע את כל הפקודות של פרוטוקול זה.
ראשית, אנחנו צריכים לבצע את המקור כדי להפוך את כל הכלים של פרוטוקול זה זמין. עליך לגשת לקבצי ה- Script של הספריות. כדי לבצע ניתוח תמלול, עליך להוריד תחילה את גנום הייחוס.
כדי לבצע את הפקודות הבאות. לאחר הורדת הגנום, עליך להוריד את הביאורים של הגנים. כדי לעשות זאת, עליך להקליד את הפקודות הבאות.
לאחר מכן, עליך להגדיר את fastq-dump. פעולה זו מאפשרת לך להוריד את קבצי הרצף של הדוגמאות. לאחר הקלדת הפקודות הבאות, עליך להשתמש בלחצן Tab כדי לעבור לאפשרות כלים ולסמן את ספריית הנוכחים של האפשרויות.
השתמש בלחצני Tab כדי לשמור ולאחר מכן אישור. ואז לצאת מהכלי מהיר-dump. עכשיו אנחנו יכולים ליזום את ההורדות של הקריאות על ידי הקלדת הפקודות הבאות.
בקרת האיכות מורכבת ומעריכה באופן גרפי את ההסתברות לשגיאות בקריאה של הריצוף. בשלב זה, עליך גם להסיר את הרצפים הטכניים כגון מתאמים. כדי ליצור את תרשימי בקרת האיכות, עליך להפעיל את תוכנית FastQC.
כדי להסיר את רצפי המתאם ואת הרצפים באיכות נמוכה, עליך להקליד את הפקודות הבאות. עם הקריאות באיכות טובה, אנחנו צריכים עכשיו למפות את הקריאות לגנום הייחוס. לאחר המיפוי, נצטרך להוסיף ביאורים לגנים על פי הגנים האנושיים ואז לספור את מספר הקריאות התואמות לכל גן אנושי.
השלב הראשון הוא ליצור אינדקס של גנום הייחוס על-ידי הקלדת הפקודה הבאה. ואז אנחנו מקלידים את הפקודות האלה כדי למפות את הקריאות לגנום האנושי. לאחר מכן, עליך להפעיל את קבצי ה- Script המביאים את הקריאות.
לאחר מיפוי וביאור, באפשרותך לבצע את ניתוח הביטוי הדיפרנציאלי המורכב מלמצוא את הגנים שהביטוי שלהם גבוה או נמוך יותר בקבוצה אחת בהשוואה לאחרת. כדי לזהות את הגנים המבוטאים באופן דיפרנציאלי, או DEGs, עליך להפעיל את הפקודות הבאות. לאחר מכן, באפשרותך להעביר את תוצאות הנתונים מה- Docker למחשב המקומי שלך.
לקבלת זאת, עבור אל המסוף והקלד את הפקודות הבאות כדי לשמור את כל התוצאות בתיקיה מקומית. כדי לבצע את הניתוח הנותר, עליך גם להעתיק את כל הקבצים של נתוני הספריה לספריה במחשב המקומי שלך. במחשב המקומי שלך, תוכל לראות את הספריות שבהן שמרת את הנתונים מ- Docker.
כפי שאתה יכול לראות, אתה יכול לגשת לכל הספריות. באפשרותך גם לפתוח את קובץ ה- HTML המכיל את דוחות בקרת האיכות. באפשרותך גם לגשת לספריה המכילה את הגנים המבוטאים באופן דיפרנציאלי.
ובתוך הספריה הזו, תמצאו את חלקות הר הגעש שבהן תוכלו לראות את הגנים שנמצאים למעלה או מוזנחים בקבוצה אחת לעומת אחרת, במקרה זה, חולים נגועים בנגיף צ'יקונגוניה לעומת בקרות בריאות. כל השלבים הנותרים של פרוטוקול זה יבוצעו בכלי אינטרנט באמצעות הדפדפן שלך. בואו נתחיל קודם עם CEMiTool.
עבור אל הדפדפן והקלד את הכתובת הבאה. CEMiTool מזהה מודולי ביטוי משותף מתוך ערכות נתונים של ביטוי המסופקים על-ידי המשתמשים. בדף הראשי, באפשרותך לעבור לתפריט וללחוץ על הלחצן הפעל.
פעולה זו תפתח דף חדש שבו תוכל להעלות את קובץ הביטוי. קובץ זה נמצא בנתוני הספריות של המחשב המקומי שלך. אתה תראה שיש שלושה קבצי ביטוי, וזה שאנחנו הולכים להשתמש עבור CEMiTool הוא נורמליזציה שיחה tmm.
אז אתה צריך לבחור את קובץ פנודטה, אותו הדבר עבור הקובץ המכיל את אינטראקציות חלבון-חלבון, ולבסוף, להעלות את הקובץ המכיל את ערכות הגנים או מסלולים. קובץ ערכות הגנים מאפשר ל- CEMiTool לבצע ניתוח העשרה עבור כל אחד ממודול הביטוי המשותף. לאחר מכן, עליך להרחיב את מקטע הפרמטרים וללחוץ תחת החל VST.
לאחר מכן, אתה יכול פשוט ללחוץ על הפעל CEMiTool. לאחר הפעלת CEMiTool, תראה שזוהו 12 מודולי ביטוי משותף. על ידי לחיצה כאן, אתה יכול להוריד את כל התוצאות של ניתוחים אלה.
כלי נוסף שאנחנו הולכים להשתמש בפרוטוקול זה הוא MDP, או דרגה מולקולרית של Perturbation. פשוט הקלד את הדפדפן שלך mdp.sysbio.tools. MDP מחשב את המרחק המולקולרי של כל מדגם בהשוואה לקבוצת התייחסות של דגימות, במקרה זה, את הפקדים הבריאים, על מנת למצוא לא רק חריגים פוטנציאליים אלא גם עד כמה מוטרדים כל דגימות בהשוואה לקבוצה זו.
בדף 'הפעלה', באפשרותך פשוט להעלות את קובץ הביטוי על-ידי לחיצה על הלחצן ובחירת הקובץ. אז אתה צריך להעלות את קובץ פנודטה. לאחר מכן עליך להגדיר איזו עמודה מכילה את המידע אודות הקבוצה או המחלקה ולאחר מכן איזו מחלקה או קבוצה תואמות לקבוצת הביקורת.
אחרי זה, אתה יכול פשוט להפעיל MDP. גרף העמודות מציג עבור כל אחת מהדגימות כסרגל את הציון של דרגה מולקולרית של שיבוש, והצבעים מייצגים את הקבוצות השונות. והתוויה של התיבה היא דרך נוספת לדמיין את אותן תוצאות שבהן רואים בכל נקודות את הדגימות השונות בנפרד משתי קבוצות.
כדי לבצע את הניתוח הפונקציונלי, אנחנו הולכים להשתמש בכלי מעשיר. בשביל זה, אתה צריך לבחור את רשימת הגנים שבאו לידי ביטוי באופן דיפרנציאלי, למעלה או downregulated, ולהשתמש בו כרשימת גנים קלט בכלי מעשיר. תראה שקיימות כרטיסיות שונות.
ניתן גם להוריד את כל התוצאות למחשב המקומי שלך. סביבת המחשב לניתוח תמלול הוצבה על פלטפורמת Docker. גישה זו מאפשרת למשתמשים ללא ניסיון קודם עם מערכת לינוקס להשתמש במסוף.
בגורם מכיל זה, קיים מבנה תיקיות מוגדר מראש עבור ערכת נתונים וקבצי Script הנחוצים לכל הניתוח. בצנרת, משתמשים ישתמשו בנתוני תמלול הדם מ -20 אנשים בריאים ו -39 חולים נגועים בחריפות בנגיף Chikungunya. פלטפורמת הרצף מחזירה קבוצה של קבצי FASTQ המכילים את רצף ה- DNA, כלומר.
הקריאות, והאיכות המשויכת לכל בסיס נוקלאוטיד. סולם האיכות Phred מציין את ההסתברות לקריאה שגויה עבור כל בסיס. כלים מזהים ומסירים קריאות באיכות נמוכה מדגימות ומגדילים את ההסתברות למיפוי קריאות.
בשלב זה, מודול המיפוי, קריאות באיכות גבוהה התאושש משמשים תשומות כדי ליישר אותם נגד הגנום התייחסות אנושי. CEMiTool מזהה ומנתח מודולי ביטוי משותף. גנים בתוך אותו מודול באים לידי ביטוי משותף, מה שאומר שהם מציגים דפוסי ביטוי דומים על פני הדגימות של ערכות הנתונים.
ניתוח הרשת מספק מידע על הגנים המחוברים ביותר, כלומר הרכזות. שמות הגנים האלה מוצגים ברשת.
גודל הצמתים הוא פרופורציונלי במידת הקישוריות שלו. התוצאות שהתקבלו מניתוח DEG סוכמו בחלקות הר הגעש. ניתוח מידת ההסתעפות המולקולרית מאפשר זיהוי של דגימות מוטרדות מאנשים בריאים ונגועים.
MDP מציע אילו דגימות הן חריגות ביולוגיות פוטנציאליות. הסרת דגימות אלה תשפיע על התוצאות במורד הזרם. ניתוח העשרה פונקציונלי באמצעות AURA יכול להתבצע באמצעות הכלי Enrichr.
שלבים אלה מסייעים לפרש את התוצאות על ידי חשיפת תפקידים פונקציונליים נפוצים של מספר גנים שבאו לידי ביטוי באופן דיפרנציאלי. התהליך הביולוגי המוצג בתרשימי העמודות הם עשרת ערכות הגנים המועשרות המובילות בהתבסס על דירוג ערך ה- p שלהם. לסיכום, פרוטוקולים אלה מכסים את כל השלבים של ניתוח RNA-Seq.
הצינור פותח ועטוף במערכת הלא מסחרית בשם Docker. על תמונה וזמין עבור הקהילה המדעית. בשל מערכת הגורם המכיל, כל קבצי ה- Script והכלים נמצאים תחת אותה גירסה ספציפית כדי להבטיח שכפול.
יתר על כן, חלקים מניתוח הביו-אינפורמטיקה בוצעו באמצעות כלי אינטרנט ידידותיים למשתמש בחינם.