A subscription to JoVE is required to view this content. Sign in or start your free trial.
Method Article
פרוטוקול זה מנחה ביואינפורמטיקה מתחילים באמצעות צינור ניתוח CUT&RUN מבוא המאפשר למשתמשים להשלים ניתוח ראשוני ואימות של נתוני רצף CUT&RUN. השלמת שלבי הניתוח המתוארים כאן, בשילוב עם ביאור שיא במורד הזרם, תאפשר למשתמשים להסיק תובנות מכניסטיות לגבי ויסות הכרומטין.
טכניקת CUT&RUN מאפשרת זיהוי אינטראקציות חלבון-דנ"א ברחבי הגנום. יישומים אופייניים של CUT&RUN כוללים שינויי פרופיל בשינויים בזנב היסטון או מיפוי תפוסת כרומטין של גורם שעתוק. אימוץ נרחב של CUT&RUN מונע, בחלקו, על ידי יתרונות טכניים על פני ChIP-seq קונבנציונאלי הכוללים דרישות קלט תאים נמוכות יותר, דרישות עומק ריצוף נמוכות יותר ורגישות מוגברת עם אות רקע מופחת עקב מחסור בחומרים צולבים המסווים אפיטופים של נוגדנים. אימוץ נרחב של CUT&RUN הושג גם באמצעות שיתוף נדיב של ריאגנטים על ידי מעבדת הניקוף ופיתוח ערכות מסחריות להאצת האימוץ למתחילים. ככל שהאימוץ הטכני של CUT&RUN גדל, ניתוח ריצוף CUT&RUN ותיקוף הופכים לצווארי בקבוק קריטיים שיש להתגבר עליהם כדי לאפשר אימוץ מלא על ידי צוותי מעבדה רטובים בעיקר. ניתוח CUT&RUN מתחיל בדרך כלל בבדיקות בקרת איכות על קריאות ריצוף גולמיות כדי להעריך את עומק הרצף, איכות הקריאה והטיות פוטנציאליות. לאחר מכן הקריאות מיושרות להרכבת רצף גנום ייחוס, ולאחר מכן נעשה שימוש במספר כלים ביואינפורמטיים כדי לבאר אזורים גנומיים של העשרת חלבונים, לאשר את יכולת פענוח הנתונים ולהסיק מסקנות ביולוגיות. למרות שצינורות ניתוח מרובים בסיליקו פותחו כדי לתמוך בניתוח נתונים של CUT&RUN, המבנה הרב-מודולי המורכב שלהם והשימוש בשפות תכנות מרובות מקשים על הפלטפורמות למתחילים בתחום הביואינפורמטיקה שאולי חסרים היכרות עם שפות תכנות מרובות אך מעוניינים להבין את הליך הניתוח של CUT&RUN ולהתאים אישית את צינורות הניתוח שלהם. כאן, אנו מספקים פרוטוקול צינור ניתוח CUT&RUN בשפה אחת שלב אחר שלב המיועד למשתמשים עם כל רמה של ניסיון בביואינפורמטיקה. פרוטוקול זה כולל השלמת בדיקות איכות קריטיות כדי לאמת שנתוני הריצוף מתאימים לפענוח ביולוגי. אנו מצפים כי ביצוע פרוטוקול המבוא המסופק במאמר זה בשילוב עם ביאור שיא במורד הזרם יאפשר למשתמשים להסיק תובנות ביולוגיות ממערכי הנתונים שלהם CUT&RUN.
היכולת למדוד אינטראקציות בין חלבונים לדנ"א גנומי היא בסיסית להבנת הביולוגיה של ויסות הכרומטין. בדיקות יעילות המודדות את תפוסת הכרומטין עבור חלבון נתון מספקות לפחות שתי פיסות מידע עיקריות: i) לוקליזציה גנומית ו-ii) שפע חלבונים באזור גנומי נתון. מעקב אחר שינויי גיוס ולוקליזציה של חלבון בעל עניין בכרומטין יכול לחשוף מוקדי מטרה ישירים של החלבון ולחשוף תפקידים מכניסטיים של חלבון זה בתהליכים ביולוגיים מבוססי כרומטין, כגון ויסות שעתוק, תיקון DNA או שכפול DNA. הטכניקות הזמינות כיום לפרופיל אינטראקציות חלבון-דנ"א מאפשרות לחוקרים לחקור רגולציה ברזולוציה חסרת תקדים. התקדמות טכנית כזו התאפשרה באמצעות הכנסת טכניקות פרופיל כרומטין חדשות הכוללות פיתוח של מחשוף תחת מטרות ושחרור באמצעות נוקלאז (CUT&RUN) על ידי מעבדת הניקוף. CUT&RUN מציעה מספר יתרונות טכניים על פני משקעים חיסוניים קונבנציונליים של כרומטין (ChIP) הכוללים דרישות קלט תאים נמוכות יותר, דרישות עומק ריצוף נמוכות יותר ורגישות מוגברת עם אות רקע מופחת עקב מחסור בחומרים צולבים המסווים אפיטופים של נוגדנים. אימוץ טכניקה זו לחקר ויסות הכרומטין דורש הבנה מעמיקה של העיקרון העומד בבסיס הטכניקה, והבנה כיצד לנתח, לאמת ולפרש נתוני CUT&RUN.
הליך CUT&RUN מתחיל בקשירת תאים ל- Concanavalin A מצומדים לחרוזים מגנטיים כדי לאפשר מניפולציה של מספרי תאים נמוכים לאורך כל ההליך. תאים מבודדים עוברים חדירה באמצעות חומר ניקוי עדין כדי להקל על החדרת נוגדן המכוון לחלבון המעניין. לאחר מכן מגויסים נוקלאז מיקרוקוקלי (MNase) לנוגדן הקשור באמצעות חלבון A או תג חלבון A/G הקשור לאנזים. סידן הוא הציג כדי ליזום פעילות אנזימטית. עיכול MNase גורם לקומפלקסים מונו-נוקלאוזומליים של חלבוני DNA. לאחר מכן סידן עובר תצבית כדי לסיים את תגובת העיכול, ומקטעי דנ"א קצרים מעיכול MNase משתחררים מגרעינים, ואז נתונים לטיהור דנ"א, הכנת ספרייה וריצוף בתפוקה גבוהה1 (איור 1).
בסיליקו , גישות למיפוי וכימות תפוסת חלבונים ברחבי הגנום התפתחו במקביל לגישות המעבדה הרטובות המשמשות להעשרת אינטראקציות דנ"א-חלבון אלה. זיהוי אזורים של אותות מועשרים (פסגות) הוא אחד השלבים הקריטיים ביותר בניתוח ביואינפורמטיקה. שיטות ניתוח ChIP-seq ראשוניות השתמשו באלגוריתמים כגון MACS2 ו- SICER3, שהשתמשו במודלים סטטיסטיים כדי להבחין בין אתרי קישור חלבון-DNA בתום לב לרעשי רקע. עם זאת, רעשי הרקע הנמוכים יותר והרזולוציה הגבוהה יותר של נתוני CUT&RUN הופכים חלק מתוכניות שיחות השיא המופעלות בניתוח ChIP-seq ללא מתאימות לניתוח CUT&RUN4. אתגר זה מדגיש את הצורך בכלים חדשים המתאימים יותר לניתוח נתוני CUT&RUN. SEACR4 מייצג כלי אחד כזה שפותח לאחרונה כדי לאפשר שיחות שיא מנתוני CUT&RUN תוך התגברות על מגבלות הקשורות לכלים המשמשים בדרך כלל לניתוח ChIP-seq.
פרשנויות ביולוגיות מנתוני ריצוף CUT&RUN נלקחות מהתפוקות במורד הזרם של שיחות שיא בצנרת הניתוח. ניתן ליישם מספר תוכניות ביאור פונקציונליות כדי לחזות את הרלוונטיות הביולוגית הפוטנציאלית של הפסגות הנקראות מנתוני CUT&RUN. לדוגמה, פרויקט אונטולוגיה גנטית (GO) מספק זיהוי פונקציונלי מבוסס היטב של גנים בעלי עניין 5,6,7. כלי תוכנה ומשאבים שונים מאפשרים ניתוח GO כדי לחשוף גנים ומערכי גנים המועשרים בין פסגות CUT&RUN 8,9,10,11,12,13,14. יתר על כן, תוכנות ויזואליזציה כגון Deeptools15, Integrative genomics viewer (IGV)16 ו-UCSC Genome Browser17 מאפשרות ויזואליזציה של התפלגות אותות ודפוסים באזורים מעניינים ברחבי הגנום.
היכולת להסיק פרשנויות ביולוגיות מנתוני CUT&RUN תלויה באופן קריטי באימות איכות הנתונים. רכיבים קריטיים לאימות כוללים הערכה של: i) איכות רצף ספריית CUT&RUN, ii) דמיון לשכפל, ו- iii) התפלגות אותות במרכזי שיא. השלמת האימות של כל שלושת הרכיבים חיונית כדי להבטיח את האמינות של דוגמאות ספריית CUT&RUN ותוצאות ניתוח במורד הזרם. לכן, חיוני להקים מדריכי ניתוח CUT&RUN ראשוניים כדי לאפשר למתחילים ביואינפורמטיקה ולחוקרי מעבדה רטובים לבצע שלבי אימות כאלה כחלק מצינורות ניתוח CUT&RUN הסטנדרטיים שלהם.
לצד הפיתוח של ניסוי CUT&RUN במעבדה רטובה, פותחו צינורות ניתוח שונים בסיליקו CUT&RUN, כגון CUT&RUNTools 2.018,19, nf-core/cutandrun20 ו-CnRAP21, לתמיכה בניתוח נתוני CUT&RUN. כלים אלה מספקים גישות רבות עוצמה לניתוח ערכות נתונים של CUT&RUN ו- CUT&Tag של תא בודד וצובר של CUT&TAG. עם זאת, מבנה התוכנית המודולרי המורכב יחסית וההיכרות הנדרשת עם שפות תכנות מרובות לביצוע צינורות ניתוח אלה עלולים לעכב אימוץ על ידי מתחילים בתחום הביואינפורמטיקה המבקשים להבין לעומק את שלבי הניתוח של CUT&RUN ולהתאים אישית את הצינורות שלהם. עקיפת מחסום זה דורשת צינור ניתוח CUT&RUN מבוא חדש המסופק בסקריפטים פשוטים שלב אחר שלב המקודדים באמצעות שפת תכנות יחידה פשוטה.
במאמר זה, אנו מתארים פרוטוקול צינור ניתוח CUT&RUN פשוט בשפה אחת המספק סקריפטים שלב אחר שלב הנתמכים עם תיאורים מפורטים כדי לאפשר למשתמשים חדשים ומתחילים לבצע ניתוח רצף CUT&RUN. תוכניות המשמשות בצינור זה זמינות לציבור על-ידי קבוצות המפתחים המקוריות. השלבים העיקריים המתוארים בפרוטוקול זה כוללים יישור קריאה, קריאת שיא, ניתוח פונקציונלי, ובאופן הקריטי ביותר, שלבי אימות להערכת איכות הדגימה כדי לקבוע התאמה ואמינות של נתונים לפענוח ביולוגי (איור 2). יתר על כן, צינור זה מספק למשתמשים את ההזדמנות להצליב תוצאות ניתוח עם ערכות נתונים CUT&RUN הזמינות לציבור. בסופו של דבר, פרוטוקול צינור ניתוח CUT&RUN זה משמש כמדריך מבוא והפניה למתחילים בניתוח ביואינפורמטי ולחוקרי מעבדה רטובה.
הערה: מידע עבור קובצי CUT&RUN fastq ב- GSE126612 זמין בטבלה 1. מידע הקשור ליישומי התוכנה המשמשים במחקר זה מופיע בטבלת החומרים.
1. הורדת צינור Easy-Shells_CUTnRUN מדף Github שלו
2. התקנת התוכניות הדרושות עבור Easy Shells CUTnRUN
3. הורדת ערכת הנתונים CUT&RUN הזמינה לציבור מארכיון קריאת רצף (SRA)
4. בדיקת איכות ראשונית לקבצי הרצף הגולמי
5. חיתוך איכות ומתאם לקבצי רצף גולמיים
6. הורדת אינדקס Bowtie2 עבור גנומי הייחוס עבור דגימות בקרה בפועל וספייק-אין
7. מיפוי ריצוף CUT&RUN חתוך קורא לגנומי הייחוס
8. מיון וסינון קבצי זוגות הקריאה הממופים
9. המרת זוגות קריאה ממופים לפיצול קבצי BEDPE, BED ו- Raw readcounts bedGraph
10. המרת קבצי bedGraph של ספירות קריאה גולמיות לקבצי bedGraph ו-bigWig מנורמלים
11. אימות התפלגות גודל הקטע
12. שיחות שיא באמצעות MACS2, MACS3 ו- SEACR
13. יצירת קבצי peak bed נקראים
14. אימות הדמיון בין העותקים המשוכפלים באמצעות מתאם פירסון וניתוח רכיב ראשי (PC).
15. אימות הדמיון בין עותקים משוכפלים, שיטות קריאת שיא ואפשרויות באמצעות דיאגרמת חיתוך קבוצות (Venn)
16. ניתוח מפות חום ומגרשים ממוצעים לדמיין פסגות שנקראות.
איכות וחיתוך המתאם שומרים על קריאות באיכות רצף גבוהה
טכניקות ריצוף בתפוקה גבוהה נוטות ליצור שגיאות ריצוף כגון 'מוטציות' רצף בקריאה. יתר על כן, ניתן להעשיר דימרים של מתאם רצף בערכות נתונים של רצף עקב הסרת מתאם לקויה במהלך הכנת הספרייה. שגיאות ריצוף מוגזמות, כגון...
היכולת למפות את תפוסת החלבונים על הכרומטין היא בסיסית לביצוע מחקרים מכניסטיים בתחום הביולוגיה של הכרומטין. ככל שמעבדות מאמצות טכניקות מעבדה רטובות חדשות לפרופיל כרומטין, היכולת לנתח נתוני ריצוף מאותם ניסויי מעבדה רטובים הופכת לצוואר בקבוק נפוץ עבור מדעני מעבדה רטובה. ...
המחברים מצהירים כי אינם חושפים.
כל הדמויות המאוירות נוצרו עם BioRender.com. CAI מכירה בתמיכה הניתנת באמצעות פרס חוקר הקריירה המוקדמת של הברית לחקר סרטן השחלות, מענק מאיץ של קרן פורבק ופרס המחקר הלאומי לגילוי מוקדם של הברית לסרטן השחלות של מינסטואה.
Name | Company | Catalog Number | Comments |
bedGraphToBigWig | ENCODE | https://hgdownload.soe.ucsc.edu/admin/exe/ | Software to compress and convert readcounts bedGraph to bigWig |
bedtools-2.31.1 | The Quinlan Lab @ the U. of Utah | https://bedtools.readthedocs.io/en/latest/index.html | Software to process bam/bed/bedGraph files |
bowtie2 2.5.4 | Johns Hopkins University | https://bowtie-bio.sourceforge.net/bowtie2/index.shtml | Software to build bowtie index and perform alignment |
CollectInsertSizeMetrics (Picard) | Broad institute | https://github.com/broadinstitute/picard | Software to perform insert size distribution analysis |
Cutadapt | NBIS | https://cutadapt.readthedocs.io/en/stable/index.html | Software to perform adapter trimming |
Deeptoolsv3.5.1 | Max Planck Institute | https://deeptools.readthedocs.io/en/develop/index.html | Software to perform Pearson coefficient correlation analysis, Principal component analysis, and Heatmap/average plot analysis |
FastQC Version 0.12.0 | Babraham Bioinformatics | https://github.com/s-andrews/FastQC | Software to check quality of fastq file |
Intervenev0.6.1 | Computational Biology & Gene regulation - Mathelier group | https://intervene.readthedocs.io/en/latest/index.html | Software to perform venn diagram analysis using peak files |
MACSv2.2.9.1 | Chan Zuckerberg initiative | https://github.com/macs3-project/MACS/tree/macs_v2 | Software to call peaks |
MACSv3.0.2 | Chan Zuckerberg initiative | https://github.com/macs3-project/MACS/tree/master | Software to call peaks |
Samtools-1.21 | Wellcome Sanger Institute | https://github.com/samtools/samtools | Software to process sam/bam files |
SEACRv1.3 | Howard Hughes Medial institute | https://github.com/FredHutch/SEACR | Software to call peaks |
SRA Toolkit Release 3.1.1 | NCBI | https://github.com/ncbi/sra-tools | Software to download SRR from GEO |
Trim_Galore v0.6.10 | Babraham Bioinformatics | https://github.com/FelixKrueger/TrimGalore | Software to perform quality and atapter trimming |
Request permission to reuse the text or figures of this JoVE article
Request PermissionThis article has been published
Video Coming Soon
Copyright © 2025 MyJoVE Corporation. All rights reserved