פרוטוקול זה מתאר צעדים ביואינפורמטיים לחקירת האבולוציה המולקולרית והביטוי של גנים מועמדים. כאן אנו מספקים הוראות יסודיות כך שכל מי שיש לו ניסיון ביואינפורמטי מינימלי יכול לרוץ דרך פרוטוקול זה. צינור זה יכול להיות מיושם על כל אורגניזם וכל משפחת גנים.
בעיה נפוצה אחת בעת ביצוע ביואינפורמטיקה היא סקריפטים מעטפת נכשל. בעת ניסיון לבצע פרוטוקול זה, ודא שותקת את התוכנה העדכנית ביותר, קרא את קבצי השגיאה ועיין במדריך בקפידה. כדי להתחיל, היכנס לחשבון אשכול המחשב בחלון מסוף או יישום PuTTY.
על המסוף, להוריד SRA Toolkit גירסה 2.8.1 באמצעות Wget, ולאחר מכן לסיים את התקנת התוכנית. חפש ב- NCBI את מספר ההצטרפות של SRA עבור הדגימות הרצויות ולאחר מכן השג את נתוני רצף ה- RNA בחלון המסוף. השג שני קבצי FASTQ עבור סוג קבצים עם קצה משויך.
מצא את גנום הייחוס באינטרנט אם קיים. כדי להשיג הרכבה של הפניה, הקלד wget בחלון המסוף והדבק את כתובת הקישור. אם זמין, גם להעתיק את קובץ GTF וקובץ FASTA חלבון עבור הגנום הפניה.
צור אינדקס של הגנום ולאחר מכן מפה קוראת ומחשבת ביטוי עבור כל דגימה. שנה את שם קובץ התוצאות למשהו תיאורי וצור מטריצה של כל הספירות. פתח חלון דפדפן אינטרנט עבור אל NCBI GenBank.
בסרגל החיפוש, הקלד את שם גן העניין ואת השם של מינים קרובים אשר כבר רצף. מימין ל סרגל החיפוש, בחר חלבון ולאחר מכן לחץ על חיפוש. חלץ את הרצפים על-ידי לחיצה על שלח אל ולאחר מכן בחר קובץ.
תחת עיצוב, בחר FASTA ולאחר מכן לחץ על צור קובץ. העבר קובץ FASTA של הומולוגים לאשכול המחשבים באמצעות חלון מסוף מקומי או FileZilla. לאחר מכן, חפשו גנים מועמדים באמצעות BLAST+על אשכול המחשבים, צרו מסד נתונים של BLAST מהגנום או חלבון מתורגם לתעתיק, FASTA.
הפיצוץ רצפי הגנים homologous מ NCBI למסד הנתונים של המינים של עניין, ולאחר מכן להציג את קובץ הפלט באמצעות הפקודה יותר. העתק מזהי גנים ייחודיים ממין מעניין לקובץ טקסט חדש. לחלץ את הרצפים של גנים מועמדים.
כדי לאשר ביאור גנים באמצעות REciprocal BLAST, עבור אל כלי החיפוש של היישור המקומי BLAST, בחר BLASTP ולאחר מכן הדבק את רצפי המועמדים, בחר את מסד הנתונים הלא מיותר של רצף החלבונים ולחץ על BLAST. פתח את מגה, לחץ על ישר ולאחר מכן ערוך יישור בניה, בחר צור יישור חדש ולחץ על אישור. בחר חלבון. כאשר חלון היישור נפתח, לחץ על ערוך.
לחץ על הוסף רצפים מקובץ ובחר את FASTA עם רצפי חלבונים של גנים מועמדים והומולוגים סבירים. בחר את כל הרצפים. מצא את סמל הזרוע ורחף מעליו.
זה צריך לומר ליישר רצפים באמצעות אלגוריתם שריר. לחץ על סמל הזרוע ולאחר מכן לחץ על ישר חלבון כדי ליישר את הרצפים ערוך פרמטרים או לחץ על אישור כדי להשתמש בפרמטרי ברירת המחדל. פרוטוקול זה הוחל על רקמות של הידרה וולגריס שהיא חסרת חוליות במים מתוקים השייכת לפילום קנידריה.
גנים Opsin נחקרו כדי לקבל תובנה האבולוציה של עיניים וגילוי אור בבעלי חיים. רצפים עבור גנים הקשורים opsin של H.vulgaris ומינים אחרים חולצו לתוך קובץ FASTA מן GenBank NCBI. הגנים opsin היו מיושרים מגה, מה שמאפשר לזהות opsins הידרה שהיו חסרים חומצת אמינו שימורי ליצין הדרושים כדי לקשור מולקולה רגישה לאור.
עץ בעל סבירות גבוהה נוצר באמצעות רצפי אופסין מהידרה וולגריס ומינים אחרים. הפילוגניה מרמזת על כך שגנים של אופסין מתפתחים על ידי כפילויות ספציפיות לשושלת אצל קנידרים, ופוטנציאל על ידי כפילויות טנדם ב- H.vulgaris. לאחר מכן, ניתוח ביטוי דיפרנציאלי בוצע ב- edgeR כדי לחקור ביטוי מוחלט של גנים opsin.
כדי לקבוע אם אופסינים אחד או יותר מוסדרים בהיפוסטום, או בראש, בוצעו השוואות מבחינת זוג של היפוסטום לעומת עמוד הגוף, אזור ניצנים, רגל וצרועות. נמצא כי 1,774 תעתיקים באו לידי ביטוי באופן דיפרנציאלי בין ההיפוסטום לטור הגוף. הגנים שהיו מוסדרים על פני השוואות מרובות נקבעו, והעשרה תפקודית Blast2GO בוצעה.
לבסוף, הביטוי המוחלט של גנים opsin נחקר ברקמות שונות בשלבים שונים של ניצנים, ובמהלך נקודות זמן שונות של התחדשות. בדיקה ויזואלית של היישור והעץ תאשר אם הגנים המועמדים שייכים למשפחת העניין. גנים שונים מדי ברצף או קבוצה מחוץ לכל דבר אחר, הם כנראה חלק ממשפחת גנים אחרת.
תוצאות מפרוטוקול זה יכולות להיחשב כמחוללות השערות. צינור זה יכול להדגיש גנים מועמדים ללמוד פונקציונלית במחקרים עתידיים. לאחר חקירת ביטוי הידרה opsin, אנו משתמשים כעת בטכניקות דומות כדי לחקור גנים קשורים על פני מינים על מנת לזהות קווי דמיון והבדלים בתפקוד.