Sign In

A subscription to JoVE is required to view this content. Sign in or start your free trial.

In This Article

  • Summary
  • Abstract
  • Introduction
  • Protocol
  • תוצאות
  • Discussion
  • Disclosures
  • Acknowledgements
  • Materials
  • References
  • Reprints and Permissions

Summary

ניתוח אות לרעש ברמת חומצת אמינו קובע מהי השכיחות של וריאציה גנטית במיקום נתון חומצת אמינו מנורמל על רקע וריאציה גנטית של אוכלוסיה נתונה. דבר זה מאפשר זיהוי של variant "נקודות חמות" בתוך רצף חלבונים (אות) המתנשא מעל התדירות של שמתגלה נדירה באוכלוסיה (רעש).

Abstract

החידושים העלות ואת המהירות של הדור הבא רצף גנטי שיצר פיצוץ של exome כל קליניים ובדיקות הגנום כולו. בזמן זה הוביל זיהוי מוגברת של מוטציות פתוגניים סביר הקשורים עם תסמונות גנטיות, זה גם באופן דרמטי גדל המספר אגב מצא וריאציות גנטיות של משמעות לא ידוע (VUS). קביעת משמעות קלינית גרסאות אלה היא אתגר גדול עבור רופאים ומדענים. גישה זו כדי לסייע בקביעת הסבירות פתוגניות הוא ניתוח אות לרעש באותה רמת חלבון רצף. פרוטוקול זה מתאר שיטה לניתוח אות לרעש ברמת חומצת אמינו המנצלת תדר משתנה במיקום כל חומצת אמינו של החלבון עם חלבון ידוע טופולוגיה כדי לזהות אזורים של הרצף ראשי עם הסבירות מוגברות של וריאציה פיפטות (ביחס האוכלוסייה וריאציה "רקע"). שיטה זו ניתן לזהות מיקום משקע חומצת אמינו "נקודות חמות" סימן פיפטות גבוהה, בו ניתן להשתמש כדי ללטש את המשקל אבחון של VUSs כגון אלה המזוהה על-ידי הבא הדור בדיקה גנטית.

Introduction

השיפור המהיר ב רצף גנטי פלטפורמות יש מהפכה את הנגישות ואת תפקיד הגנטיקה ברפואה. ברגע מרותק גן יחיד, או חופן של גנים, הקטנת עלויות ולהגביר מהירות של הדור הבא רצף גנטי הוביל רצף שגרתי של מכלול של הגנום של קידוד רצף (exome כל רצף, ווס), (את כל הגנים רצף הגנום כולו, WGS) בסביבה קלינית. וס ו- WGS שימשו לעיתים קרובות בסביבה של neonates חולה אנוש, וילדים עם חשש לתסמונת גנטית איפה כלי אבחון מוכחת שיכולים לשנות ניהול קליני1,2. בזמן זה הוביל זיהוי מוגברת של מוטציות פתוגניים סביר הקשורים עם תסמונות גנטיות, הוא גדל גם באופן דרמטי את מספר וריאציות גנטיות מצאו דרך אגב, או תוצאות חיוביות לא צפוי, של האבחון לא ידוע משמעות (VUS). בעוד כמה גרסאות אלה הם התעלמו, לא דווחו, הווריאציות ההתאמה לשפות אחרות כדי גנים הקשורים קטלנית או חולנית מאוד מחלות מדווחים לעתים קרובות. הנחיות הנוכחי ממליצים דיווח של משתנים מקריים נמצאו גנים ספציפיים אשר ייתכן כי היתרון רפואי למטופל, כולל גנים הקשורים להתפתחות פתאומית הלב מוות-נטייה למחלות כמו cardiomyopathies ו channelopathies3. למרות המלצה זו תוכננה כדי ללכוד אנשים בסיכון של מחלה נטייה-רואים את זה, הרגישות של זיהוי variant ובמעמד ירידה לפרטים. זו באה לידי ביטוי מספר גדל והולך של VUSs, דרך אגב מקבילו גרסאות לא ברורה של תוכנית השירות לאבחון רחוק עולה על התדר של מחלות המתאימות אוכלוסיה נתונה4. אחת כזו, תסמונת QT ארוך (LQTS), היא מחלת channelopathy לב הקנוני נגרמת על ידי מוטציות ההתאמה לשפות אחרות כדי גנים אשר לקודד תעלות יונים הלב, או ערוץ אינטראקציה חלבונים, וכתוצאה מכך מתעכבת רה-פולריזציה לב5. זה מתעכב רה-פולריזציה, על ידי אלקטרוקרדיוגרם ממושכת על נח רל, התוצאה נטייה חשמל כדי קטלנית להפרעה כמו torsades דה pointes. בעוד מספר גנים קושרו להתפתחות של מחלה זו, מוטציות בגן KCNQ1-מקודדים אניKs אשלגן (KCNQ1, Kv7.1) הוא הגורם LQTS סוג 1 וערוץ מנוצל כדוגמה מתחת6. הממחישות את המורכבות פרשנות variant, הנוכחות של גרסאות נדיר גנים הקשורים LQTS, שנקרא "רקע וריאציה גנטית" כבר שתואר לעיל7,8.

בנוסף גדולה ועיצובה בסגנון מאגרי מידע הווריאנטים המוכרים פתוגניים, קיימים מספר אסטרטגיות לניבוי שגרסאות שונות של אפקט יהיה לייצר. חלקם מבוססים על אלגוריתמים, כגון לנפות, Polyphen 2, אשר יכול לסנן מספר גדול של גרסאות הרומן-שם נרדף לחזות deleteriousness9,10. למרות לשימוש נרחב של כלים אלה, ירידה לפרטים נמוכה מגבילה הישימות שלהם כשמדובר "קורא" VUSs קלינית11. ניתוח "אות לרעש" הוא כלי אשר מזהה את הסבירות של variant להיות קשור עם המחלה מבוסס על התדר של וריאציה פיפטות ידוע ב לוקוסים המדובר מנורמל נגד וריאציה גנטית נדירה מתוך אוכלוסיה. הווריאציות ההתאמה לשפות אחרות מנחלת גנטי בו יש שכיחות גבוהה של מוטציות הקשורות במחלה לעומת האוכלוסייה המבוססת על וריאציה, גבוהה אות לרעש, הם נוטים יותר להיות מחלה-הקשורים עצמם. עוד, נדיר שמתגלה אגב ההתאמה לשפות אחרות כדי גן עם תדירות גבוהה של האוכלוסייה נדיר משתנים בהשוואה תדר הקשורים למחלה, נמוך אות לרעש, עשוי להיות פחות סביר הקשורים למחלה. תוכנית השירות לאבחון של ניתוח אות לרעש כבר מאויר בהנחיות העדכנית ביותר עבור בדיקה גנטית עבור cardiomyopathies ו- channelopathies; עם זאת, זה רק כבר מועסקים רמת גן שלם או ספציפיים ברמה12. לאחרונה, ניתנה מגדיל את הזמינות של פיפטות משתנים (מחלת מסדי נתונים, המחזור מחקרים בספרות) והן משתני בקרה מבוסס-אוכלוסייה (קונסורציום צבירה Exome, חכי, אניה, מסד הנתונים צבירת הגנום, GnomAD13), זה הוחל למיקום חומצת אמינו בודדות בתוך הרצף העיקרי של חלבון. ניתוח אות לרעש ברמת חומצת אמינו הוכיח שימושי לסיווג גרסאות שזוהו אגב גנים הקשורים LQTS ככל הנראה וריאציה גנטית "רקע" ולא הקשורים למחלה. בין הגנים העיקריים שלושה המשויך LQTS, כולל KCNQ1, אלה גרסאות שזוהו אגב חסרה יחס אות לרעש משמעותית, רומז כי תדירות גרסאות אלה-חומצת אמינו בודדות עמדות מבטאות נדיר וריאציה האוכלוסייה במקום מוטציות הקשורות במחלה. יתר על כן, כאשר התחום הספציפי-חלבון טופולוגיה ומצופה נגד אזורים של מוטציה אות לרעש, פיפטות גבוהה "נקודות חמות" מקומי לתחומים פונקציונלי מפתח של חלבונים14. מתודולוגיה זו טומן בחובו הבטחה בקביעת שהסבירות 1) משתנה היא מחלה או אוכלוסייה-הקשורים ו 2) זיהוי הרומן תחומים פונקציונליים קריטי של חלבון המשויך מחלות אנושיות.

Protocol

1. לזהות את הגן ואת ספציפי אחוי Isoform עניין

הערה: כאן, נדגים את השימוש Ensembl15 כדי לזהות את רצף קונצנזוס עבור הגן עניין אשר משויך בפתוגנזה של המחלה של הריבית (כלומר KCNQ1 מוטציות משויכים LQTS). חלופות Ensembl כוללים RefSeq באמצעות המרכז הלאומי לביוטכנולוגיה מידע (NCBI)16 , אוניברסיטת קליפורניה, סנטה קרוז (UCSC) דפדפן הגנום האנושי17 (ראה טבלה של חומרים).

  1. בתוך הבית Ensembl, בחר המין (קרי אנושי) בתפריט הנפתח והזן את הגן של ראשי תיבות עניין בשטח (כלומר KCNQ1). לחץ על "לך"
  2. בחר את הקישור המתאים הגן עניין (קרי "KCNQ1 (גנים אנושיים)"
  3. בחר את הקישור התואם בתמליל של עניין מזהה עניין מהשולחן"תעתיק" (דהיינו TranscriptID ENST00000155840.10, NM_000218 [תעתיק רנ א], NP_000209 [חלבון תוצר של תעתיק רנ א]).
    הערה: סקירה של הספרות הרלוונטי יש צורך להבטיח שרצף קונצנזוס התעתיק הנכון נבחר.
  4. הערה את התעתיק הספציפי NM ו NP מספרי זיהוי לשימוש עתידי בעמודה "RefSeq" של השולחן"תעתיק".
  5. בחר את הקישור המשויך מספר מזהה NP לפתוח דף אינטרנט חדש ממסד הנתונים NCBI חלבון.
  6. גלול מטה אל המקטע "מקור" כדי להשיג את חלבון הרצף (ראשית) על-ידי ג'ין עניין.
  7. גלול למעלה בסעיף "תכונות" כדי לקבל רשימה של התכונות חלבון (תחומים פונקציונליים, מחייב תחומים, שינוי post-translational אתרי).
    הערה: המידע הזה ניתן להשיג באמצעות מסד הנתונים NCBI חלבון או ממקורות ראשוניים בספרות. זה יידונו נוספת בשלב 5.

2. יצירת הנתונים Variant גנטי ניסיוני ("אות")

הערה: כאן, נדגים כיצד ליצור מסד נתונים של משתנים הקשורים למחלה בגן עניין עם התדר של המשתנים הקשורים המחלה בקרב אנשים עם המחלה של עניין. מסד נתונים זה יכול לקחת צורות רבות, והוא מייצג את "אות" (וריאציה גנטית פנוטיפ-חיוביים) אשר אפשרות לנרמל מול מסד הנתונים variant שליטה. זה יכול לכלול גרסאות 1) מחלות הקשורות להשוואה נגד VUSs לזהות תחומים תפקודית הרומן חלבון ו/או 2) VUSs, כולל דרך אגב זיהו VUSs, להשוואה משתנים הקשורים למחלה כדי לקבוע את הסבירות פתוגניות. משתנים הקשורים למחלה ב KCNQ1, יוצגו להמחשה; עם זאת, השיטה זו זהה עבור ניתוח של VUSs המזוהים אגב או כל קבוצה אחרת של משתנים ניסיוני.

  1. לזהות את cohort(s) של אינדקס במקרים שאינם קשורים/probands עם המחלה עניין עבורו הגן עניין היה genotyped באופן מקיף עבור כל probands (כלומר מחקר מזהה 24 probands שאינם קשורים אירוח גרסאות KCNQ1 מתוך 200 אנשים עם LQTS היו נתון בחקירה גנטי KCNQ1).
    הערה: ניתן לזהות קוהורטות אלה בספרות, מתוך ניסיוני ניתוח גנטי, או שילוב של שניהם.
    1. אל תכלול לימודים שאינם מבוססי עוקבה (כלומר דו ח מקרה מוטציה-חיוביים בודדים), אינם מעניקים את המספר הכולל של אנשים genotyped הגן של עניין, או לא מנתחים באופן מקיף גנטית (את ג'ין כלומר הקרנה גנטי "יישוב" של exons KCNQ1 רק 2-4) אלה למנוע חישוב שכיחות של variant.
    2. כוללים אינדיבידואלים הם לא קשורים probands ולהשמיט אנשים קרובים כמו זה יכולים להעריך יתר על המידה תדרי וריאנט (כלומר מחקר מזהה 4 אנשים שאינם קשורים עם מוטציות KCNQ1 במדגם של 20 חולים עם LQTS. אחד probands האלה הוא חלק ממשפחה עם 5 ברוחן מוטציה-חיוביים אחרים. לא לכלול כל בני המשפחה, כוללים רק את probands לא קשורים 4).
  2. לקמפל את כל הווריאציות גנטי ניסיוניים נמצאו cohort(s) מזוהה
    1. להקצות במינוח המכיל את חומצת אמינו פראי-סוג, מיקום חומצת אמינו, חומצת אמינו variant (קרי אלנין חומצה אמינית מספר 212 שינתה ולין, Ala212Val או A212V). אחד סוג כזה של המינוח הוא הפגין באיור1.
    2. לאשר כי המינוח משתנה של כל המשתנים גנטי ניסיוני מבוסס על הפניה באותו הגן התעתיק שכאמור בשלב 1.4. אם ניסיוני וריאציות גנטיות הן לא מבואר בתעתיק גנים התייחסות זהה, ואז reannotate בעמדה variant תעתיק הפניה באמצעות פרוטוקול יישור (ראה שלב 1.2)
  3. הכללת משתנים שאינם ישימים בהתאם השאלה להיות חקר.
    1. אל תכלול גרסאות לוקליזציה לאזורים ללא קידוד של הגנום או גרסאות אשר לא תשנה את החלבון רצף כגון גרסאות נרדף, intronic, אזור לא מתורגם, 5" או 3' [UTR] ואזור intergenic גרסאות (קרי דווח על פיפטות משתנה ב- KCNQ1 אשר רגישה ל 5' UTR של האזור קידוד תשתף כפי הוא לא ניבא כדי לשנות את רצף החלבון).
    2. הכללת משתנים שאינם עונים הכללה קריטריונים לצורך המחקר. עבור משתנים הקשורים למחלה, כולל גרסאות כבר לא נחשבים פיפטות.
      1. לוודא כי כל משתנה כיום נחשב פתוגניים, סביר להניח פתוגניים, או לפחות לא שפירים נצליב גרסאות עם מסד הנתונים ClinVar (ראה טבלה של חומרים).
      2. הזן את ג'ין ואת variant עניין לתוך שדה חיפוש ClinVar (קרי KCNQ1-Y111C), בחר באפשרות "חיפוש"
      3. לזהות את הווריאציה של עניין תחת העמודה "וריאציה/מיקום".
      4. שימו לב הקונצנזוס פרשנות פתוגניות תחת העמודה "משמעות קלינית" (דהיינו KCNQ1-Y111C מפרשים כמו "פתוגניים").
      5. כוללים גרסאות שהן "סביר פתוגניים" או "פתוגניים".
      6. כוללים גרסאות עם כינויי "סותר פירושים של פתוגניות," "משמעות לא בטוח", או כאשר אין רישום זמין ("לא סיפקה") ובמידת לחדר העבודה.
      7. לא לכלול גרסאות כמנהל "סביר שפיר" (דהיינו KCNQ1-A62T).
  4. לחשב את תדירות אלל מינור (MAF) לכל תפקיד variant ניסיוני.
    1. לחשב איך כל אללים היו חיוביות עבור כל משתנה בהתאמה (כלומר אם המוטציה משפחתית ולא משפחתית הטרוזיגוטיים נמצא אצל אנשים שאינם קשורים 2, המספר של אללים משתנה-חיובי Y111C KCNQ1 2).
    2. לחשב את המספר הכולל של אללים וסודרו בתוך קבוצה
      1. הערה המספר הכולל של יחידים וסודרו במחקר עוקבה כל (שלב 2.1)
      2. הכפילו את המספר הכולל של יחידים ב- 2 כדי לקבוע את המספר הכולל של אללים.
        הערה: זה שקיימות הגנום דיפלואידי לפיה כל המארחים בודדים 2 של כל אלל.
    3. לחשב את המספר הכולל של אנשים משתנה-חיובית לכל תפקיד חומצה אמינית (אללים ב 2.4.1/alleles שלב שלב 2.4.2). לדוגמה, אם 2 לא קשור יחידים בכל לארח משפחתית ולא משפחתית הטרוזיגוטיים מוטציות KCNQ1-Y111C גדודים של 100 ו-200 שצוותו LQTS יחידים, בהתאמה, אז התדירות של משתנים ניסיוני במיקום חומצת אמינו 111 היא 2 גרסאות/((100+200 individuals ) * 2 אללים/הפרט) (כלומר משולב MAF 0.0033).
    4. לחשב ערך זה עבור כל משתנה כמו MAF בהתאמה של כל משתנה ניסיוני. לפרטים נוספים ראה שלב 4.2.

3. יצירת בקרה גנטית Variant מסד הנתונים ("רעש")

הערה: כאן, נדגים כיצד ליצור מסד נתונים של משתני בקרה בגן עניין בתדירות הקשורים באוכלוסיה שליטה. מסד נתונים זה מייצג את "הרעשים" (פנוטיפ-שלילי, האוכלוסייה המבוססת על וריאציה גנטית) המהווה הרקע שמולו אפשרות לנרמל את מסד הנתונים variant ניסיוני. זה נקרא כווריאציית "שליטה".

  1. לזהות את cohort(s) של probands בריא, לא קשורים או לנצל גדול האוכלוסייה המבוססת על מחקרים לזיהוי. גרסאות נדיר בקרב אוכלוסיה נתונה.
    הערה: מקורות עבור מסד נתונים זה הינם מגוונים וכוללים: 1) אנשים בריאים ו/או אחרת פנוטיפ-שלילי יחידים נתון סנגר רצף או שהוחזקו מסדי נתונים של האוכלוסייה המבוססת על יחידים אשר המחלה המדוברת היא נדיר שתדירותם כגון 2) פרויקט הגנום 1000 (N = נושאים 1,094)18, 3) הלאומי ללב, ריאות, דם מכון ללכת על פרוייקט רצף של Exome (ESP, N = נושאים 5,379)19, 4) Exome צבירת Consortium (חכי, אניה, N = נושאים 60,706)13 , ו/או 5) הגנום צבירת מסד הנתונים (GnomAD, N = אנשים 138,632)13 (ראה טבלה של חומרים). מסד הנתונים GnomAD ב'טבלת בתור דוגמה להמחשה.
    1. הזן את הגן עניין בתיבת החיפוש בדף הבית GnomAD (קרי KCNQ1).
    2. לאשר כי הדפדפן שבחרת את הגן הנכון ואת תעתיק של עניין (שלב 1.4).
    3. לוודא כי קיים כיסוי מתאים של רצף של מיקומה על-ידי סקירת "כלומר כיסוי" עלילה "כיסוי."
    4. בחר עבור קידוד רצף וריאציה גנטית על-ידי בחירה "Missense + LoF."
    5. בחר באפשרות ייצוא "שולחן" ל CSV, אשר תיצור קובץ TextEdit בשם "לא ידוע".
    6. Relabel הקובץ וכלול את סיומת חדשה "*. csv" (כלומר "KCNQ1 שליטה Variation.csv").
    7. פתח את הקובץ באמצעות תוכנית תוכנה מתאימה לניתוח של קבצי *. csv (ראה טבלה של חומרים).
  2. לזהות את החלבון משתנה וריאציה גנטית בעמודה שכותרתו "תוצאה חלבון".
  3. להחיל אותו לקבלת פטור למשתנים גנטי אלה שליטה גם גרסאות גנטי ניסיוני (שלב 2.3.1).
  4. לזהות את MAF של כל משתנה שליטה.
    1. אתר את העמודה "אלל חשוב", אשר מציין את המספר של אללים נמצא הנמל variant.
    2. אתר את העמודה "מספר אלל", אשר מציין את המספר הכולל של אללים וסודרו בזה בהתחשב בעמדה חומצת אמינו.
      הערה: המספר הכולל של אללים רציף משתנה בהתאם כיסוי במיקום זה. אזורי כיסוי גבוה ייגש 2 * המספר הכולל של בודדים בתוך GnomAD (קרי עבור אנשים 138,632, כיסוי מלא מקיף הכולל אללים 277,264 genotyped).  לעומת זאת, אזורי כיסוי נמוך יהיה מספר מופחת אלל סה
    3. לאתר את הווריאציה MAF אשר מחושב מראש בעמודה "אלל תדר" מייצג "אלל ספירת" מחולק "אלל מספר."
      הערה: הגנום האנושי, יש לי שני כל אלל (כלומר 1 הנושא נמצא כי גרסה משפחתית ולא משפחתית הטרוזיגוטיים 10 אנשים יש MAF של 1/20)
    4. הערה את MAF עבור כל משתנה כמו MAF בהתאמה של כל משתנה שליטה.
      הערה: MAF ספציפית משתנה עבור כל קבוצה גזעית/אתניים הכוללת GnomAD ניתן לראות העמודות מימין "תדירות אלל."
  5. החלת סף MAF עבור גרסאות נדיר שמעליה בקרת גרסאות אינם נכללים כמו "נפוץ".
    1. הגדר את הסף MAF לערך מקסימלי שבה כלולים כל באמת מחלה-הקשורים המשתנים (ראה שלב 2) ציין גם במסד הנתונים של הפקד מתחת לסף (קרי, בין כל מחלה-הקשורים KCNQ1 שמתגלה גם ב GnomAD וריאנט נפוץ הגבוהה MAF היא 0.009, אז לא להיות כלולים כל הווריאציות GnomAD מעל לסף מסוים של 0.01 פג).
  6. ודא כי המינוח משתנה ניסיוני זהים לפקד (ראה שלב 2.2).
  7. שמור את הקובץ. במקרים מסוימים, זה עשוי לדרוש שינוי הסוג/סיומת הקובץ.

4. חומצה אמינית אות לרעש רמת חישוב ומיפוי

  1. חישוב של MAF לכל תפקיד חומצה אמינית בווריאציה שליטה (ראה איור 1 הכולל דוגמה KCNQ1 GnomAD גרסאות).
    1. יכולת יצירת גרפים בגיליון אלקטרוני, ליצור עמודה של העמדות של כל המשתנים ניסיוני.
    2. להסיר את הטקסט משתנה לעזוב רק המיקום משתנה.
      הערה: פונקציות שונות/נוסחאות יכול להיות מנוצל כדי למחוק באופן אוטומטי אלה רכיבי טקסט בתוך תאים (איור 1, עמודה C; ראה טבלה של חומרים).
    3. למיין את גרסאות עולה ערך כדי לזהות עמדות יש גרסה יותר 1 המשויכים אליה (איור 1, עמודה E; כלומר חומצת אמינו המיקום 10 מופיע פעמיים בעמודה E אשר מציין 2 גרסאות ייחודי במיקום).
    4. לשלב את MAF עבור כל משתנה המשויך עמדה נתונה על ידי לקיחת הסכום של כל MAFs לתפקיד נתון (איור 1, עמודה G ו- H).
  2. חישוב של MAF לכל תפקיד חומצה אמינית עם גרסה ניסיונית (ראה איור 2 המכיל גרסאות פיפטות KCNQ1 מעושה).
    1. באופן דומה כדי 4.1.1, ליצור עמודה של עמדות חומצת אמינו אשר יש גרסאות ניסיוני (איור 2, עמודה B).
    2. לכל תפקיד variant, לחשב את MAF של כל המשתנים הקשורים באותו מיקום מ שלב 2.4 (איור 2, עמודה C-G).
  3. צור-מסתובב הממוצע של MAF לשניהם ניסיוני, בקרת גרסאות.
    1. להרחיב את העמודות שנוצרו ב- 4.1 ו- 4.2 לכלול תאים למשרות חומצת אמינו שיש לא משתנה כמו MAF = 0. (איור 3).
      1. צור עמודה המכילה את כל העמדות חומצת אמינו בגן של הריבית (כלומר 1 כדי 676 עבור KCNQ1, איור 3, עמודה C ואני).
      2. להוסיף על MAF של 0 עבור כל העמדות שאין משתני הבקרה וגם ערכות נתונים ניסיוני.
        הערה: ניתן לבצע זאת באופן אוטומטי על-ידי שימוש בפונקציה "VLOOKUP" שימוש נפוץ תוכנה (איור 3, עמודה D ו- J, ראה טבלה של חומרים).
    2. צור-מסתובב הממוצע עבור כל ניסיוני ועמודה השכיחות של שליטה.
      הערה: זה מאפשר הסקה של מיקום סמוכים פתוגניות, ניתן לשינוי, או אפילו נשלל, להתאים את הצרכים של המחקר.
      1. יצירת עמודת המייצג ממוצע מתגלגל של MAF לשניהם השליטה וגם ערכות נתונים ניסיוני (איור 3, עמודה E ו- K).
      2. במקום העמודה ממוצע מתגלגל, הממוצע של MAF המתאימים לתפקידים variant 5 וריאציות של N-מסוף ו- 5 עמדות C-מסוף למצב נתון.
        הערה: זו יוצרת-מסתובב הממוצע של + /-5. למשרות עם שאריות חומצה אמינית פחות מ-5 הקודם, או בעקבות, מיקום ממוצע מתגלגל (כלומר N - או קצה קרבוקסילי), ממוצע מתגלגל רק תיקח בחשבון את שאריות הקיימים (קרי לגלגל את הממוצע ב חומצת אמינו עמדה 3 יהיה בממוצע MAF-חומצת אמינו עמדות 1 על פי 8, מחושב כסכום של אלה MAFs לחלק ל 8).
  4. לחשב את התדר המינימלי שליטה על-ידי חלוקת את MAF מתגלגל הנמוך ביותר ב- 2.
    1. לשנות תא כלשהו עם פקד MAF 0 התדר המינימלי כדי למנוע חלוקה ב- 0 בעת חישוב יחס אות לרעש.
  5. לחשב את חומצת אמינו יחס אות לרעש ברמה (איור 4).
    1. לחלק לכל תפקיד חומצה אמינית ניסיוני מתגלגל הממוצע על-ידי הפקד המתאים מתגלגל הממוצע.
    2. גרף יחס (ציר y) לעומת חומצת אמינו עמדה זו (ציר x).

5. חלבון תחום טופולוגיית שכבת-

  1. מזהים את המיקומים חומצת אמינו הקונצנזוס של תכונות/תחומים פונקציונליים, או אזורים של השינוי post-translational, של החלבון עניין (שלב 1.7).
    הערה: מספר משאבים יכול להיות מנוצל כדי לזהות תחומים אלה. משאבים אלה, כמו גם המשאבים לזיהוי תחומים בשם בחלבונים הרומן, נבדקו היטב הספרות20. פרוטוקול זה יתאר את מסד הנתונים חלבון זמין דרך NCBI, אשר הוא מנוצל באופן נרחב, חזקים (ראה טבלה של חומרים).
  2. זיהוי עמדות חומצת אמינו המשויך חלבון תכונות/תחומים.
    1. פתח את דף האינטרנט NCBI.
    2. הזן את NP של החלבון עניין בשדה החיפוש.
    3. לזהות תחומים חלבון ידוע ויש תכונות קטלוגים תחת "תכונות".
    4. לזהות ורשום את העמדות שם/סוג ושל חומצות אמינו של התחום.
    5. בחר את הקישור המתאים בתכונה כדי להמחיש את האזור על חלבון רצף הראשי עניין.
  3. צור עמודה המכילה את הגבולות של התכונות/המחשבים.
    1. יצירת עמודת לצד העמודה רעש: אות העמודה מיקום חומצת אמינו שניתן יהיה הפניה (איור 5א, עמודה C).
    2. לזהות את התאים המתאים-ההיבט N-מסוף או C-מסוף של כל תחום/תכונה ומקום 1 בכל תא (כלומר אם N-מסוף בתחום המחשבים transmembrane S1 של KCNQ1 הוא חומצה אמינית עמדה 122, התחום C-מסוף הוא מיקום 142, ואז 1 תוצב בשורה לתפקיד חומצת אמינו 122 ו- 142).
    3. עבור תכונות/תחומים חופפים, להציג תחומים מרובים על-ידי שינוי של 1 בערכים אחרים (קרי 1.5, 2, 2.5); זה יכול לסייע להבחין בין תחומים.
  4. ליצור גרף עם גבולות אלה עמדה-y ואת חומצת אמינו בציר ה-x (איור 5B).
  5. שכבת-על הגרף הזה עם גרף אות לרעש שנוצר בשלב 4.4.
  6. לזהות מתאמים בין חלבון ידוע תחומים/תכונות וניתוח האות לרעש.

6. שכבת-על המיקום משתנה

  1. מפת תפקידים variant בודדים עבור כיסוי של תרשימי המופק בשלבים 4.4 ו- 5.4.
    1. ליצור עמודה לצד העמודה תחום/תכונה כזאת השורות בעמודה יתאים את חומצת אמינו עמדות (איור 5א, עמודה D).
    2. מקום 1 בכל תא בשורה נוספת המתאימה לתפקיד הכולל משתנה בהתאמה.
    3. ליצור גרף עם עמודה זו עמדה-y ואת חומצת אמינו בציר ה-x (איור 5C).
  2. שכבת-על הגרף הזה עם גרף אות לרעש שנוצר בשלב 4.4, גרף תחום שנוצר בשלב 5.4.

תוצאות

תוצאה נציג לאות חומצת אמינו ברמת רעש ניתוח עבור KCNQ1 מתואר באיור6. בדוגמה זו, נדיר גרסאות שזוהו במדגם GnomAD (בקרת עוקבה), המזוהים אגב ווס משתנים (ניסיוני עוקבה #1), משתנים הקשורים במקרה של LQTS ייחשב סביר הקשורים למחלה (ניסיוני עוקבה #2) מתוארים. עוד יותר, הניתוח אות ...

Discussion

בדיקות סקר גנטיות תפוקה גבוהה כולל מתקדמת באופן דרמטי היישום ואת זמינות בעשור האחרון. עם זאת, מחלות רבות עם בסיס גנטי ומבוססת, כגון cardiomyopathies, בדיקה מורחבת הצליחה לשפר את התשואה אבחון21. יתר על כן, יש משמעותי הוודאות בכלי אבחון של משתנים רבים שזוהו. . זאת חלקית בשל מספר גדל והולך ש...

Disclosures

המחברים אין לחשוף.

Acknowledgements

APL נתמך על ידי נבחרת מוסדות של בריאות K08-HL136839.

Materials

NameCompanyCatalog NumberComments
1000 Genome ProjectN/Awww.internationalgenome.org
ClinVarN/Awww.ncbi.nlm.nih.gov/clinvar
Ensembl Genome BrowserN/Auswest.ensembl.org/index.html
ExcelMicrosoftoffice.microsoft.com/excel/Used for all example formulas and functions
Exome Aggregation Consortium N/Awww.exac.broadinstitute.org
Genome Aggregation Database N/Awww.gnomad.broadinstitute.org
National Center for Biotechnology Information Domain and Structure DatabaseN/Awww.ncbi.nlm.nih.gov/guide/domains-structures/
National Center for Biotechnology Information Gene DatabaseN/Awww.ncbi.nlm.nih.gov/gene/
National Center for Biotechnology Information Protein DatabaseN/Awww.ncbi.nlm.nih.gov/protein/
National Heart, Lung, and Blood Institute GO Exome Sequencing ProjectN/Awww.evs.gs.washington.edu/EVS/
SnapGeneGSL Biotech LCCwww.snapgene.com
University of California, Santa Cruz Human Genome BrowserN/Awww.genome.ucsc.edu

References

  1. Yang, Y., et al. Clinical whole-exome sequencing for the diagnosis of mendelian disorders. New England Journal of Medicine. 369 (16), 1502-1511 (2013).
  2. Meng, L., et al. Use of Exome Sequencing for Infants in Intensive Care Units: Ascertainment of Severe Single-Gene Disorders and Effect on Medical Management. Journal of the American Medical Association Pediatrics. 171 (12), 173438 (2017).
  3. Kalia, S. S., et al. Recommendations for reporting of secondary findings in clinical exome and genome sequencing, 2016 update (ACMG SF v2.0): a policy statement of the American College of Medical Genetics and Genomics. Genetics in Medicine. 19 (2), 249-255 (2017).
  4. Landstrom, A. P., Ackerman, M. J. The Achilles' heel of cardiovascular genetic testing: distinguishing pathogenic mutations from background genetic noise. Clinical Pharmacology and Therapeutics. 90 (4), 496-499 (2011).
  5. Landstrom, A. P., Tester, D. J., Ackerman, M. J., Lawless, C. Role of genetic testing for sudden death predisposing heart conditions in athletes. Sports Cardiology Essentials. , (2011).
  6. Wang, Q., et al. Positional cloning of a novel potassium channel gene: KVLQT1 mutations cause cardiac arrhythmias. Nature Genetics. 12 (1), 17-23 (1996).
  7. Kapa, S., et al. Genetic testing for long-QT syndrome: distinguishing pathogenic mutations from benign variants. Circulation. 120 (18), 1752-1760 (2009).
  8. Ackerman, M. J., et al. Ethnic differences in cardiac potassium channel variants: implications for genetic susceptibility to sudden cardiac death and genetic testing for congenital long QT syndrome. Mayo Clinic Proceedings. 78 (12), 1479-1487 (2003).
  9. Kumar, P., Henikoff, S., Ng, P. C. Predicting the effects of coding non-synonymous variants on protein function using the SIFT algorithm. Nature Protocols. 4 (7), 1073-1081 (2009).
  10. Adzhubei, I., Jordan, D. M., Sunyaev, S. R. Predicting functional effect of human missense mutations using PolyPhen-2. Current Protocols in Human Genetics. , (2013).
  11. Flanagan, S. E., Patch, A. M., Ellard, S. Using SIFT and PolyPhen to predict loss-of-function and gain-of-function mutations. Genetic Testing and Molecular Biomarkers. 14 (4), 533-537 (2010).
  12. Ackerman, M. J., et al. HRS/EHRA expert consensus statement on the state of genetic testing for the channelopathies and cardiomyopathies this document was developed as a partnership between the Heart Rhythm Society (HRS) and the European Heart Rhythm Association (EHRA). Heart Rhythm. 8 (8), 1308-1339 (2011).
  13. Lek, M., et al. Analysis of protein-coding genetic variation in 60,706 humans. Nature. 536 (7616), 285-291 (2016).
  14. Landstrom, A. P., et al. Amino acid-level signal-to-noise analysis of incidentally identified variants in genes associated with long QT syndrome during pediatric whole exome sequencing reflects background genetic noise. Heart Rhythm. 15 (7), 1042-1050 (2018).
  15. Hubbard, T., et al. Ensembl 2005. Nucleic Acids Research. 33, 447-453 (2005).
  16. O'Leary, N. A., et al. Reference sequence (RefSeq) database at NCBI: current status, taxonomic expansion, and functional annotation. Nucleic Acids Research. 44, 733-745 (2016).
  17. Kent, W. J., et al. The human genome browser at UCSC. Genome Research. 12 (6), 996-1006 (2002).
  18. The 100 Genome Projects Consortium. An integrated map of genetic variation from 1,092 human genomes. Nature. 491 (7422), 56-65 (2012).
  19. Fu, W., et al. Analysis of 6,515 exomes reveals the recent origin of most human protein-coding variants. Nature. 493 (7331), 216-220 (2013).
  20. Mulder, N. J., Apweiler, R. Tools and resources for identifying protein families, domains and motifs. Genome Biology. 3 (1), (2002).
  21. Cirino, A. L., et al. A Comparison of Whole Genome Sequencing to Multigene Panel Testing in Hypertrophic Cardiomyopathy Patients. Circulation Cardiovascular Genetics. 10 (5), (2017).
  22. Landstrom, A. P., et al. Interpreting Incidentally Identified Variants in Genes Associated With Catecholaminergic Polymorphic Ventricular Tachycardia in a Large Cohort of Clinical Whole-Exome Genetic Test Referrals. Circulation Arrhythmia and Electrophysiology. 10 (4), (2017).
  23. Whiffin, N., et al. Using high-resolution variant frequencies to empower clinical genome interpretation. Genetics in Medicine. 19 (10), 1151-1158 (2017).
  24. Walsh, R., et al. Reassessment of Mendelian gene pathogenicity using 7,855 cardiomyopathy cases and 60,706 reference samples. Genetics in Medicine. 19 (2), 192-203 (2017).
  25. Buske, O. J., Manickaraj, A., Mital, S., Ray, P. N., Brudno, M. Identification of deleterious synonymous variants in human genomes. Bioinformatics. 31 (5), 799 (2015).
  26. Wen, P., Xiao, P., Xia, J. dbDSM: a manually curated database for deleterious synonymous mutations. Bioinformatics. 32 (12), 1914-1916 (2016).
  27. Bagnall, R. D., et al. Whole Genome Sequencing Improves Outcomes of Genetic Testing in Patients With Hypertrophic Cardiomyopathy. Journal of the American College of Cardiology. 72 (4), 419-429 (2018).
  28. Giudicessi, J. R., Roden, D. M., Wilde, A. A. M., Ackerman, M. J. Classification and Reporting of Potentially Proarrhythmic Common Genetic Variation in Long QT Syndrome Genetic Testing. Circulation. 137 (6), 619-630 (2018).
  29. Sundaram, L., et al. Predicting the clinical impact of human mutation with deep neural networks. Nature Genetics. 50, 1161-1170 (2018).
  30. Krittanawong, C., Zhang, H., Wang, Z., Aydar, M., Kitai, T. Artificial Intelligence in Precision Cardiovascular Medicine. Journal of the American College of Cardiology. 69 (21), 2657-2664 (2017).

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Explore More Articles

143exome

This article has been published

Video Coming Soon

JoVE Logo

Privacy

Terms of Use

Policies

Research

Education

ABOUT JoVE

Copyright © 2025 MyJoVE Corporation. All rights reserved