ניתוח אותות לרעש ברמת חומצת אמינו, מספק מדד לסבירות שגרסה גנטית קשורה למצב מחלה, או שהיא חלק מהווריאציה הגנטית הטבעית בתוך האוכלוסייה. טכניקה זו ממנפת שני משאבים גנטיים גדולים, מוטציות הקשורות למחלות, הזמינות בספרות, או במרחב הציבורי עם מחקרי אקסום וגנום מבוססי אוכלוסייה, המזהים שונות גנטית נדירה. כדי לזהות גן מסוים ו- splice isoform של עניין, לפתוח את דף הבית Ensembl, לבחור את המין מהתפריט הנפתח.
הזן את ראשי התיבות של גן העניין ולחץ על עבור. בחר את הקישורים המתאימים לגן העניין ולעניין התמלולי ואת מזהה הריבית מהטבלה תעתיק. שים לב לתמליל ה-RNA הספציפי לתעתיק ולתוצר החלבון של מספרי זיהוי של תעתיק RNA בעמודת רצף ההפניות של טבלת התמליל לעיון בעתיד.
בחר את הקישור המשויך למוצר החלבון של מספר מזהה תעתיק RNA כדי לפתוח דף אינטרנט חדש מהמרכז הלאומי למידע ביוטכנולוגיה, או מסד נתונים של חלבון NCBI, וגלול מטה למקטע מקור כדי להשיג את רצף החלבון העיקרי לתמלול הגנים המעניין. לאחר מכן גללו למעלה למקטע 'תכונות' כדי לקבל רשימה של תכונות החלבון. כדי לחשב תדירות אלל מינורית עבור כל מיקום חומצת אמינו עם וריאנט בקרה, פתח גיליון אלקטרוני בעל יכולת גרפים וצור עמודה של המיקומים של כל הגרסאות הניסיוניות.
הסר את טקסטי המשתנה כדי להשאיר רק את מיקומי המשתנים ומיין את המשתנים בערך עולה כדי לזהות לאיזה מיקומים יש יותר וריאנט משויך אחד. השג את הסכום של כל תדרי אלל המשניים עבור עמדה נתונה, על ידי שילוב תדירות אלל מינורית עבור כל גרסה המשויכת למיקום נתון, וחשב תדר אלל מינורי עבור כל תנוחת חומצת אמינו עם גרסה ניסיונית. לאחר מכן, צור עמודה של תנוחות חומצות אמינו שיש להן גרסאות ניסיוניות, וחשב את תדירות ה-allele המשנית של כל הגרסאות המשויכות למיקום זה עבור כל מיקומי הווריאציות.
כדי ליצור ממוצע מתגלגל של תדרי אלל משניים עבור גרסאות הניסוי והבקרה, צור עמודה המכילה את כל מיקומי חומצות האמינו בגן העניין, והוסף תדירות אלל מינורית של אפס עבור כל המיקומים ללא גרסאות הן עבור ערכת הנתונים של הבקרה והן עבור ערכות הנתונים הניסיוניות. כדי ליצור ממוצע מתגלגל עבור כל עמודת שכיחות ניסיונית ולשלוט בה, צור עמודה המייצגת ממוצע מתגלגל של תדירות אלל המשנית הן עבור ערכות הנתונים של הפקד והן עבור ערכות הנתונים הניסיוניות, ובעמודה הממוצעת המתגלגלת מקם את הממוצע של תדירות ה- allele המשנית המתאימה עבור חמשת מיקומי המשתנים מסוף N ומסוף C לכל מיקום. כדי לחשב את התדירות המינימלית של קבוצת המחשבים, חלק את הערך המשני הנמוך ביותר שזוהה על-ידי שניים והזן ערך זה בכל תא עם תדירות אלל משנית של פקד של אפס.
פעולה זו תימנע חלוקה באפס, בעת חישוב יחס האות לרעש. כדי לחשב את יחס האות לרעש ברמת חומצת האמינו, חלק כל מיקום חומצת אמינו בממוצע גלגול ניסיוני לפי ממוצע גלגול הבקרה המתאים, וגרף יחס זה לעומת מיקום חומצת האמינו. כדי לזהות את מיקומי חומצות האמינו הקונצנזוס של תחומים ותכונות פונקציונליים, או אזורים של שינוי תרגום פוסט של חלבון העניין, לזהות את עמדות חומצת האמינו הקשורות לתחומים ותכונות החלבון ולפתוח את דף האינטרנט NCBI.
הזן את מוצר החלבון של תעתיק ה-RNA של חלבון העניין בשדה החיפוש, וזהה את תחומי החלבון והתכונות הידועים, תחת תכונות. זהה ושים לב לשם התחום ולסוג ולמיקומי חומצת האמינו ובחר את הקישור המתאים לתכונה כדי לדמיין את האזור ברצף הראשי של החלבון המעניין. צור עמודה לצד עמודת האות לרעש, כך שניתן יהיה להפנות לעמודת המיקום של חומצת האמינו ולזהות את התאים המתאימים בהיבט מסוף N או C של כל תחום ותכונה.
לאחר מכן, מקם אחד בכל תא, צור גרף עם גבולות אלה על ציר ה- y ומיקום חומצת האמינו על ציר ה- x ו שכב גרף זה בגרף האות לרעש. כדי למפות מיקומי משתנים בודדים עבור שכבת-על של יחס האות לרעש וגרפי טופולוגיית תחום החלבון, צור עמודה לצד עמודת תכונת התחום כך ששורות בעמודה, יתאימו למיקומי חומצת האמינו ומקם עמודה אחת בכל תא בשורה שנוספה, המתאימה למיקום המכיל משתנה בהתאמה. לאחר מכן, צור גרף עם עמודה זו כציר ה- y וחומצת האמינו מיקומים על ציר ה- x, ושכבות-על של גרף זה עם גרפי טופולוגיית התחום של אות לרעש וחלבון.
כאן, תוצאה מייצגת לניתוח אות לרעש ברמת חומצת אמינו עבור מתח אשלגן מגודר ערוץ subfamily Q חבר גן אחד מתואר. שונות נדירה זוהתה בקבוצה הבקרה, ואת הניסוי זיהה אגב רצף exsome בריא, ארוך תסמונת QT במקרה הקשורים גרסאות נחשבים סבירים להיות מחלה הקשורים מוצגים. ניתוחי האות לרעש המשווים את רצף האקסום כולו, ותדירות משתנה הקוהורטה הארוכה של תסמונת QT, מנורמלת כנגד תדירות משתנה קבוצת הבקרה, מיוצגים גם הם.
בניסוי זה, הגרסאות הארוכות הקשורות לתסמונת QT הדגימו יחסי אות לרעש גבוהים בתחומים התואמים את יציקת התעלה, מסנן הבחירה, ואת מתח האשלגן מגודר ערוץ subfamily E חבר תחום אחד מחייב. לשם השוואה, גרסאות שזוהו אגב בקוהורטת רצף האקסום כולה, לא הפגינו בבירור אזורים ספציפיים של העלאת אות לרעש גבוהה, דבר המצביע על כך שגרסאות אלה משקפות את השונות הגנטית ברקע. מתודולוגיה זו יכולה להיות מיושמת כדי לאמוד את המשקל האבחוני של גרסאות בעלות משמעות לא ידועה המתעוררות במהלך בדיקות גנטיות קליניות.