JoVE Logo

Sign In

A subscription to JoVE is required to view this content. Sign in or start your free trial.

In This Article

  • Summary
  • Abstract
  • Introduction
  • Protocol
  • תוצאות
  • Discussion
  • Disclosures
  • Acknowledgements
  • Materials
  • References
  • Reprints and Permissions

Summary

פרוטוקול זה מנחה ביואינפורמטיקה מתחילים באמצעות צינור ניתוח CUT&RUN מבוא המאפשר למשתמשים להשלים ניתוח ראשוני ואימות של נתוני רצף CUT&RUN. השלמת שלבי הניתוח המתוארים כאן, בשילוב עם ביאור שיא במורד הזרם, תאפשר למשתמשים להסיק תובנות מכניסטיות לגבי ויסות הכרומטין.

Abstract

טכניקת CUT&RUN מאפשרת זיהוי אינטראקציות חלבון-דנ"א ברחבי הגנום. יישומים אופייניים של CUT&RUN כוללים שינויי פרופיל בשינויים בזנב היסטון או מיפוי תפוסת כרומטין של גורם שעתוק. אימוץ נרחב של CUT&RUN מונע, בחלקו, על ידי יתרונות טכניים על פני ChIP-seq קונבנציונאלי הכוללים דרישות קלט תאים נמוכות יותר, דרישות עומק ריצוף נמוכות יותר ורגישות מוגברת עם אות רקע מופחת עקב מחסור בחומרים צולבים המסווים אפיטופים של נוגדנים. אימוץ נרחב של CUT&RUN הושג גם באמצעות שיתוף נדיב של ריאגנטים על ידי מעבדת הניקוף ופיתוח ערכות מסחריות להאצת האימוץ למתחילים. ככל שהאימוץ הטכני של CUT&RUN גדל, ניתוח ריצוף CUT&RUN ותיקוף הופכים לצווארי בקבוק קריטיים שיש להתגבר עליהם כדי לאפשר אימוץ מלא על ידי צוותי מעבדה רטובים בעיקר. ניתוח CUT&RUN מתחיל בדרך כלל בבדיקות בקרת איכות על קריאות ריצוף גולמיות כדי להעריך את עומק הרצף, איכות הקריאה והטיות פוטנציאליות. לאחר מכן הקריאות מיושרות להרכבת רצף גנום ייחוס, ולאחר מכן נעשה שימוש במספר כלים ביואינפורמטיים כדי לבאר אזורים גנומיים של העשרת חלבונים, לאשר את יכולת פענוח הנתונים ולהסיק מסקנות ביולוגיות. למרות שצינורות ניתוח מרובים בסיליקו פותחו כדי לתמוך בניתוח נתונים של CUT&RUN, המבנה הרב-מודולי המורכב שלהם והשימוש בשפות תכנות מרובות מקשים על הפלטפורמות למתחילים בתחום הביואינפורמטיקה שאולי חסרים היכרות עם שפות תכנות מרובות אך מעוניינים להבין את הליך הניתוח של CUT&RUN ולהתאים אישית את צינורות הניתוח שלהם. כאן, אנו מספקים פרוטוקול צינור ניתוח CUT&RUN בשפה אחת שלב אחר שלב המיועד למשתמשים עם כל רמה של ניסיון בביואינפורמטיקה. פרוטוקול זה כולל השלמת בדיקות איכות קריטיות כדי לאמת שנתוני הריצוף מתאימים לפענוח ביולוגי. אנו מצפים כי ביצוע פרוטוקול המבוא המסופק במאמר זה בשילוב עם ביאור שיא במורד הזרם יאפשר למשתמשים להסיק תובנות ביולוגיות ממערכי הנתונים שלהם CUT&RUN.

Introduction

היכולת למדוד אינטראקציות בין חלבונים לדנ"א גנומי היא בסיסית להבנת הביולוגיה של ויסות הכרומטין. בדיקות יעילות המודדות את תפוסת הכרומטין עבור חלבון נתון מספקות לפחות שתי פיסות מידע עיקריות: i) לוקליזציה גנומית ו-ii) שפע חלבונים באזור גנומי נתון. מעקב אחר שינויי גיוס ולוקליזציה של חלבון בעל עניין בכרומטין יכול לחשוף מוקדי מטרה ישירים של החלבון ולחשוף תפקידים מכניסטיים של חלבון זה בתהליכים ביולוגיים מבוססי כרומטין, כגון ויסות שעתוק, תיקון DNA או שכפול DNA. הטכניקות הזמינות כיום לפרופיל אינטראקציות חלבון-דנ"א מאפשרות לחוקרים לחקור רגולציה ברזולוציה חסרת תקדים. התקדמות טכנית כזו התאפשרה באמצעות הכנסת טכניקות פרופיל כרומטין חדשות הכוללות פיתוח של מחשוף תחת מטרות ושחרור באמצעות נוקלאז (CUT&RUN) על ידי מעבדת הניקוף. CUT&RUN מציעה מספר יתרונות טכניים על פני משקעים חיסוניים קונבנציונליים של כרומטין (ChIP) הכוללים דרישות קלט תאים נמוכות יותר, דרישות עומק ריצוף נמוכות יותר ורגישות מוגברת עם אות רקע מופחת עקב מחסור בחומרים צולבים המסווים אפיטופים של נוגדנים. אימוץ טכניקה זו לחקר ויסות הכרומטין דורש הבנה מעמיקה של העיקרון העומד בבסיס הטכניקה, והבנה כיצד לנתח, לאמת ולפרש נתוני CUT&RUN.

הליך CUT&RUN מתחיל בקשירת תאים ל- Concanavalin A מצומדים לחרוזים מגנטיים כדי לאפשר מניפולציה של מספרי תאים נמוכים לאורך כל ההליך. תאים מבודדים עוברים חדירה באמצעות חומר ניקוי עדין כדי להקל על החדרת נוגדן המכוון לחלבון המעניין. לאחר מכן מגויסים נוקלאז מיקרוקוקלי (MNase) לנוגדן הקשור באמצעות חלבון A או תג חלבון A/G הקשור לאנזים. סידן הוא הציג כדי ליזום פעילות אנזימטית. עיכול MNase גורם לקומפלקסים מונו-נוקלאוזומליים של חלבוני DNA. לאחר מכן סידן עובר תצבית כדי לסיים את תגובת העיכול, ומקטעי דנ"א קצרים מעיכול MNase משתחררים מגרעינים, ואז נתונים לטיהור דנ"א, הכנת ספרייה וריצוף בתפוקה גבוהה1 (איור 1).

בסיליקו , גישות למיפוי וכימות תפוסת חלבונים ברחבי הגנום התפתחו במקביל לגישות המעבדה הרטובות המשמשות להעשרת אינטראקציות דנ"א-חלבון אלה. זיהוי אזורים של אותות מועשרים (פסגות) הוא אחד השלבים הקריטיים ביותר בניתוח ביואינפורמטיקה. שיטות ניתוח ChIP-seq ראשוניות השתמשו באלגוריתמים כגון MACS2 ו- SICER3, שהשתמשו במודלים סטטיסטיים כדי להבחין בין אתרי קישור חלבון-DNA בתום לב לרעשי רקע. עם זאת, רעשי הרקע הנמוכים יותר והרזולוציה הגבוהה יותר של נתוני CUT&RUN הופכים חלק מתוכניות שיחות השיא המופעלות בניתוח ChIP-seq ללא מתאימות לניתוח CUT&RUN4. אתגר זה מדגיש את הצורך בכלים חדשים המתאימים יותר לניתוח נתוני CUT&RUN. SEACR4 מייצג כלי אחד כזה שפותח לאחרונה כדי לאפשר שיחות שיא מנתוני CUT&RUN תוך התגברות על מגבלות הקשורות לכלים המשמשים בדרך כלל לניתוח ChIP-seq.

פרשנויות ביולוגיות מנתוני ריצוף CUT&RUN נלקחות מהתפוקות במורד הזרם של שיחות שיא בצנרת הניתוח. ניתן ליישם מספר תוכניות ביאור פונקציונליות כדי לחזות את הרלוונטיות הביולוגית הפוטנציאלית של הפסגות הנקראות מנתוני CUT&RUN. לדוגמה, פרויקט אונטולוגיה גנטית (GO) מספק זיהוי פונקציונלי מבוסס היטב של גנים בעלי עניין 5,6,7. כלי תוכנה ומשאבים שונים מאפשרים ניתוח GO כדי לחשוף גנים ומערכי גנים המועשרים בין פסגות CUT&RUN 8,9,10,11,12,13,14. יתר על כן, תוכנות ויזואליזציה כגון Deeptools15, Integrative genomics viewer (IGV)16 ו-UCSC Genome Browser17 מאפשרות ויזואליזציה של התפלגות אותות ודפוסים באזורים מעניינים ברחבי הגנום.

היכולת להסיק פרשנויות ביולוגיות מנתוני CUT&RUN תלויה באופן קריטי באימות איכות הנתונים. רכיבים קריטיים לאימות כוללים הערכה של: i) איכות רצף ספריית CUT&RUN, ii) דמיון לשכפל, ו- iii) התפלגות אותות במרכזי שיא. השלמת האימות של כל שלושת הרכיבים חיונית כדי להבטיח את האמינות של דוגמאות ספריית CUT&RUN ותוצאות ניתוח במורד הזרם. לכן, חיוני להקים מדריכי ניתוח CUT&RUN ראשוניים כדי לאפשר למתחילים ביואינפורמטיקה ולחוקרי מעבדה רטובים לבצע שלבי אימות כאלה כחלק מצינורות ניתוח CUT&RUN הסטנדרטיים שלהם.

לצד הפיתוח של ניסוי CUT&RUN במעבדה רטובה, פותחו צינורות ניתוח שונים בסיליקו CUT&RUN, כגון CUT&RUNTools 2.018,19, nf-core/cutandrun20 ו-CnRAP21, לתמיכה בניתוח נתוני CUT&RUN. כלים אלה מספקים גישות רבות עוצמה לניתוח ערכות נתונים של CUT&RUN ו- CUT&Tag של תא בודד וצובר של CUT&TAG. עם זאת, מבנה התוכנית המודולרי המורכב יחסית וההיכרות הנדרשת עם שפות תכנות מרובות לביצוע צינורות ניתוח אלה עלולים לעכב אימוץ על ידי מתחילים בתחום הביואינפורמטיקה המבקשים להבין לעומק את שלבי הניתוח של CUT&RUN ולהתאים אישית את הצינורות שלהם. עקיפת מחסום זה דורשת צינור ניתוח CUT&RUN מבוא חדש המסופק בסקריפטים פשוטים שלב אחר שלב המקודדים באמצעות שפת תכנות יחידה פשוטה.

במאמר זה, אנו מתארים פרוטוקול צינור ניתוח CUT&RUN פשוט בשפה אחת המספק סקריפטים שלב אחר שלב הנתמכים עם תיאורים מפורטים כדי לאפשר למשתמשים חדשים ומתחילים לבצע ניתוח רצף CUT&RUN. תוכניות המשמשות בצינור זה זמינות לציבור על-ידי קבוצות המפתחים המקוריות. השלבים העיקריים המתוארים בפרוטוקול זה כוללים יישור קריאה, קריאת שיא, ניתוח פונקציונלי, ובאופן הקריטי ביותר, שלבי אימות להערכת איכות הדגימה כדי לקבוע התאמה ואמינות של נתונים לפענוח ביולוגי (איור 2). יתר על כן, צינור זה מספק למשתמשים את ההזדמנות להצליב תוצאות ניתוח עם ערכות נתונים CUT&RUN הזמינות לציבור. בסופו של דבר, פרוטוקול צינור ניתוח CUT&RUN זה משמש כמדריך מבוא והפניה למתחילים בניתוח ביואינפורמטי ולחוקרי מעבדה רטובה.

Protocol

הערה: מידע עבור קובצי CUT&RUN fastq ב- GSE126612 זמין בטבלה 1. מידע הקשור ליישומי התוכנה המשמשים במחקר זה מופיע בטבלת החומרים.

1. הורדת צינור Easy-Shells_CUTnRUN מדף Github שלו

  1. מסוף פתוח ממערכת ההפעלה.
    הערה: אם המשתמש אינו בטוח כיצד לפתוח מסוף ב-macOS וב-Windows, עיין בדף אינטרנט זה (https://discovery.cs.illinois.edu/guides/System-Setup/terminal/). עבור Linux, עיין בדף אינטרנט זה (https://www.geeksforgeeks.org/how-to-open-terminal-in-linux/).
  2. הורד את צינור הניתוח הדחוס מ- Github על ידי הקלדת wget https://github.com/JunwooLee89/Easy-Shells_CUTnRUN/archive/refs/heads/main.zip -O ~ / שולחן עבודה / Easy-Shells_CUTnRUN.zip בטרמינל.
  3. לאחר הורדת קובץ ה- zip, בטל את דחיסת קובץ ה- zip שהורדת על ידי הקלדת unzip ~ / שולחן עבודה / Easy-Shells_CUTnRUN.zip -d ~ / שולחן עבודה / בטרמינל.
  4. לאחר ביטול הדקומפרסיה, מחק את קובץ ה- zip על ידי הקלדת rm ~ / שולחן עבודה / Easy-Shells_CUTnRUN.zip במסוף ושנה את שם התיקיה על ידי הקלדת mv ~ / שולחן עבודה / Easy-Shells_CUTnRUN-master ~ / שולחן עבודה / קל Shells_CUTnRUN.
  5. לאחר הסרת הקובץ המכווץ, הקלד chmod +x ~/Desktop/Easy-Shells_CUTnRUN/script/*.sh במסוף כדי להגדיר את הרשאת ההפעלה עבור כל סקריפטי המעטפת בספריית העבודה. מעתה והלאה, פשוט הקלד את הנתיב ואת השם של סקריפטים פגז אלה מסוף או גרור את הסקריפטים לתוך מסוף ולהיכנס כדי להפעיל סקריפטים פגז אלה בטרמינל.
    הערה: מעטפת Bash מותקנת בדרך כלל מראש ברוב הפצות Linux. עם זאת, גרסאות macOS אחרונות אינן מספקות עוד מעטפת Bash מותקנת מראש. אם למערכת אין Bash, התקן תחילה את Bash shell. בקר בקישורים הבאים לקבלת הוראות המתארות כיצד להתקין את מעטפת Bash במערכת ההפעלה Linux (https://ioflood.com/blog/install-bash-shell-linux/) וב-macOS (https://www.cs.cornell.edu/courses/cs2043/2024sp/styled-3/#:~:text=The%20first%20thing%20you%20will,you%20will%20see%20the%20following:). סקריפטים אלה של מעטפת שלב אחר שלב נכתבים כדי ליצור תיקייה אחת ~/Desktop/GSE126612 כדי לבצע את רוב ניתוח CUT&RUN זה בספרייה זו ללא צורך בשינוי. אם המשתמש מבין כיצד להשתמש בסקריפטים אלה של מעטפת, משתמשים יכולים לשנות ולהתאים אישית קבצי script אלה של מעטפת כדי לנתח ערכות נתונים אחרות של CUT&RUN ולשנות אפשרויות בהתאם לצרכים הספציפיים לפרוייקט. כדי לקרוא ולערוך קבצי Script אלה של מעטפת, שקול להשתמש ב- Visual studio Code (https://code.visualstudio.com/) כאפשרות אחת עבור תוכנית קלה לשימוש הזמינה עבור מערכות הפעלה עיקריות.

2. התקנת התוכניות הדרושות עבור Easy Shells CUTnRUN

  1. בין סקריפטים פגז עם שם של Script_01_installation_***.sh, לגלות את סקריפט פגז של איזה שם כולל סוג מערכת ההפעלה של מערכת המשתמש. נכון לעכשיו, Easy Shells CUTnRUN תומך בסקריפט ההתקנה עבור מערכות מבוססות macOS, Debian / Ubuntu ו- CentOS/RPM.
  2. פתח את המסוף והקלד הד $SHELL כדי לבדוק את מעטפת ברירת המחדל במסוף הפעיל. אם מעטפת Bash היא מעטפת ברירת המחדל במסוף הנוכחי, המשתמשים עשויים לראות את הפריטים הבאים: /path/to/bash (או הודעה דומה כגון /bin/bash) במסוף.
  3. אם מעטפת ברירת המחדל אינה Bash, הגדר את מעטפת Bash כמעטפת ברירת מחדל על-ידי הקלדת chsh -s $(which bash) בטרמינל. אם המסוף משתמש במעטפת Bash כברירת מחדל, דלג על שלב זה.
  4. במסוף, הפעל את סקריפט מעטפת ההתקנה על ידי הקלדת ~/Desktop/Easy-Shells_CUTnRUN/scripts/Script_01_installation_***.sh או גרור את קובץ הסקריפט של המעטפת למסוף והזן.
  5. קרא את הקובץ Test_README.md בתיקייה /path/to/SEACR-1.3/Testfiles. בצע את ההוראות בקובץ README כדי להבהיר אם ה- SEACR במערכת המשתמש פועל כראוי.
    הערה: חיוני לאמת את פונקציית SEACR עם קבצי בדיקה שניתנו על ידי דף SEACR Github כדי לקבל תוצאות נכונות של שיחות שיא מנתוני CUT&RUN. לכן, בצע את ההוראות של Test_README.md ב- /path/to/SEACR-1.3/Testfiles מיד לאחר התקנת SEACR. למרות ש- Easy Shells CUTnRUN מספק סקריפטים של מעטפת התקנה עבור מערכות הפעלה מסוימות, ייתכן שקבצי script אלה לא יפעלו במערכת של משתמשים מסוימים כדי להתקין את כל התוכניות הדרושות עבור Easy Shells CUTnRUN. אם קיימת בעיה כלשהי בהתקנה, סקור את אתר האינטרנט המקורי של התוכנית שהוסרה, או בקש סיוע באמצעות דף האינטרנט בעיות של Easy Shells CUTnRUN github (https://github.com/JunwooLee89/Easy-Shells_CUTnRUN/issues).

3. הורדת ערכת הנתונים CUT&RUN הזמינה לציבור מארכיון קריאת רצף (SRA)

  1. פתח את המסוף והקלד echo $SHELL כדי לבדוק את מעטפת ברירת המחדל במסוף הפעיל. אם מעטפת Bash היא מעטפת ברירת המחדל במסוף הנוכחי, המשתמשים עשויים לראות את הפריטים הבאים: /path/to/bash (או הודעה דומה כגון /bin/bash) במסוף.
  2. אם מעטפת ברירת המחדל אינה Bash, הגדר את מעטפת Bash כמעטפת ברירת מחדל על-ידי הקלדת chsh -s $(which bash) בטרמינל. אם המסוף משתמש במעטפת Bash כברירת מחדל, דלג על שלב זה.
  3. הקלד ~/Desktop/Easy-Shells_CUTnRUN/scripts/Script_02_download-fastq.sh במסוף או גרור את קובץ הסקריפט של המעטפת למסוף והזן.
    הערה: סקריפט זה יהיה: (i) צור תיקייה אחת (~/Desktop/GSE126612/fastq) ויוריד רשימה של קבצי SRA שנכתבו בקובץ טקסט (~/Desktop/Easy-Shells_CUTnRUN/sample_info/SRR_list.txt) בתוך תיקיית fastq. לדוגמה, SRR_list.txt כולל את קובצי fastq של קבוצת משנה של GSE126612 דוגמאות CUT&RUN. (ii) הורד את קובצי fastq הגולמיים בתוך תיקיית fastq. (iii) צור תיקייה אחת (~/Desktop/GSE126612/log/fastq) ורשום קובץ יומן (download-fastq_log.txt) וקובץ מידע לדוגמה (SRR_list_info.txt) שהורדת בתוך תיקיית יומן רישום זו.
  4. לאחר הפעלת קובץ ה-script, בדוק את קובץ היומן. אם קיימת הודעת שגיאה כלשהי בתוך קובץ יומן הרישום, תקן את השגיאה ונסה שוב את שלב 3.3. אם יש בעיה כלשהי לפתרון הבעיה, בקש עזרה בדף האינטרנט בעיות Github של Easy Shells CUTnRUN (https://github.com/JunwooLee89/Easy-Shells_CUTnRUN/issues).
    הערה: כדי להקל על התרגול של צינור ניתוח CUT&RUN זה, הדגימות הבאות הזמינות לציבור מאוחזרות מ- SRA: דגימה אחת מבקרת דמה (IgG), שלוש דגימות של ארכיטקטורת כרומטין וחלבון גורם שעתוק (CTCF), ארבע דגימות המתאימות לסימן היסטון 'פעיל' (H3K27Ac), ושלוש דגימות המתאימות לאזורים של אתחול שעתוק המסומנים על ידי RNA פולימראז II (RNAPII-S5P). הריצוף בוצע כ-paired-end, ולכן מזווגים שני קבצים לכל דגימה.

4. בדיקת איכות ראשונית לקבצי הרצף הגולמי

  1. פתח את המסוף והקלד הד $SHELL כדי לבדוק את מעטפת ברירת המחדל במסוף הפעיל. אם מעטפת Bash היא מעטפת ברירת המחדל במסוף הנוכחי, המשתמשים עשויים לראות את הפריטים הבאים: /path/to/bash (או הודעה דומה כגון /bin/bash) במסוף.
  2. אם מעטפת ברירת המחדל אינה Bash, הגדר את מעטפת Bash כמעטפת ברירת מחדל על-ידי הקלדת chsh -s $(which bash) בטרמינל. אם המסוף משתמש במעטפת Bash כברירת מחדל, דלג על שלב זה.
  3. הקלד ~/Desktop/Easy-Shells_CUTnRUN/scripts/Script_03_fastQC.sh במסוף או גרור את סקריפט המעטפת למסוף והזן.
    הערה: סקריפט מעטפת זה יהיה: (i) הפעל את תוכנית FastQC עבור כל קבצי fastq גולמיים בתיקייה ~/Desktop/GSE126612/fastq וישמור את קבצי דוח בדיקת האיכות בתיקייה ~/Desktop/GSE126612/fastqc.1st . (ii) רשום קובץ יומן (fastqc.1st.log.SRR-number.txt) לכל הפעלת FastQC בתיקיית יומן (~/Desktop/GSE126612/log/fastqc.1st).
  4. לאחר השלמת הפעלת סקריפט המעטפת, סקור את קובץ יומן הרישום כדי להבהיר את הצלחת הריצה. אם קיימת הודעת שגיאה כלשהי בתוך קובץ יומן הרישום, תקן את השגיאה וחזור על שלב 4.3. אם קיימת בעיה כלשהי לפתרון הבעיה, בקש סיוע באמצעות דף האינטרנט בעיות קלות מעטפת CUTnRUN github (https://github.com/JunwooLee89/Easy-Shells_CUTnRUN/issues).
    הערה: בין קבצי הפלט, קבצי fastqc.html כוללים תוצאות בדיקת איכות ידידותיות למשתמש. אם יש בעיות איכות חמורות, לדון עם עמיתים ביואינפורמטיקה כדי לקבוע את התאמת הנתונים לניתוח במורד הזרם. דוחות בקרת איכות דומים משמשים לאישור איכות נתונים משופרת לאחר חיתוך המתאם. כדי להשתמש בסקריפט זה עבור ערכות נתונים אחרות, ערוך את הנתיב של ספריות העבודה והפלט כדי לענות על צרכי המשתמש. הבדל בולט בפירוש QC של CUT&RUN לעומת קריאות ChIP-seq הוא שקריאות כפולות ב- CUT&RUN אינן מציינות בהכרח כפילויות PCR. הסיבה לכך היא כי MNase שגויס יעכל באותם מיקומים או במקומות דומים בתוך קבוצות ניסוי.

5. חיתוך איכות ומתאם לקבצי רצף גולמיים

  1. פתח את המסוף והקלד echo $SHELL כדי לבדוק את מעטפת ברירת המחדל במסוף הפעיל. אם מעטפת Bash היא מעטפת ברירת המחדל במסוף הנוכחי, המשתמשים עשויים לראות את הפריטים הבאים: /path/to/bash (או הודעה דומה כגון /bin/bash) במסוף.
  2. אם מעטפת ברירת המחדל אינה Bash, הגדר את מעטפת Bash כמעטפת ברירת מחדל על-ידי הקלדת chsh -s $(which bash) בטרמינל. אם המסוף משתמש במעטפת Bash כברירת מחדל, דלג על שלב זה.
  3. הקלד ~/Desktop/Easy-Shells_CUTnRUN/scripts/Script_04_trimming.sh במסוף או גרור את סקריפט Script_04_trimming.sh לתוך המסוף והזן.
    הערה: סקריפט מעטפת זה יהיה: (i) הפעל את תוכנית Trim-Galore עבור כל קבצי fastq גולמיים ב ~ / שולחן עבודה / GSE126612 / fastq כדי לבצע חיתוך מתאם ואיכות. (ii) צור תיקייה אחת (~/Desktop/GSE126612/trimmed) ושמור את קובצי הפלט של Trim-Galore בתיקייה החתוכה. (iii) צור תיקיית יומן אחת (~/Desktop/GSE126612/log/trim_galore) ורשום קובץ יומן trim_galore_log_RSS-number.txt לכל ריצת Trim-Galore.
  4. לאחר השלמת ההפעלה, סקור את קובץ יומן הרישום בקפידה. אם קיימת הודעת שגיאה כלשהי בתוך קובץ יומן הרישום, תקן את השגיאה וחזור על שלב 5.3. אם קיימת בעיה כלשהי לפתרון הבעיה, בקש סיוע באמצעות דף האינטרנט בעיות קלות מעטפת CUTnRUN github (https://github.com/JunwooLee89/Easy-Shells_CUTnRUN/issues).
  5. לאחר השלמת תהליך זה, השווה את קבצי הפלט .html לקבצי fastqc.html שנוצרו ב- 4.3. שנה את הנתיב של ספריות קלט ופלט כדי לבצע את שלב החיתוך עבור קובצי fastq הממוקמים במקום אחר.

6. הורדת אינדקס Bowtie2 עבור גנומי הייחוס עבור דגימות בקרה בפועל וספייק-אין

  1. פתח את המסוף והקלד הד $SHELL כדי לבדוק את מעטפת ברירת המחדל במסוף הפעיל. אם מעטפת Bash היא מעטפת ברירת המחדל במסוף הנוכחי, המשתמשים עשויים לראות את הפריטים הבאים: /path/to/bash (או הודעה דומה כגון /bin/bash) במסוף.
  2. אם מעטפת ברירת המחדל אינה Bash, הגדר את מעטפת Bash כמעטפת ברירת מחדל על-ידי הקלדת chsh -s $(which bash) בטרמינל. אם המסוף משתמש במעטפת Bash כברירת מחדל, דלג על שלב זה.
  3. הקלד ~/Desktop/Easy-Shells_CUTnRUN/scripts/Script_05_bowtie2-index.sh במסוף או גרור את סקריפט המעטפת למסוף והיכנס.
    הערה: סקריפט זה יהיה: (i) להוריד אינדקסים Bowtie2 עבור גנומי ייחוס דגימה בפועל (אדם; hg19; בשימוש בפרסום המקורי22) וגנום ייחוס בקרה Spike-in (שמרים ניצנים; R64-1-1) לתוך תיקיית bowtie2-index (~/Desktop/Easy-Shells_CUTnRUN/bowtie2-index). (iii) רשום קובץ יומן (bowtie2-index-log.txt) לספריית יומן (~/Desktop/GSE126612/log/bowtie2-index).
  4. לאחר השלמת ההפעלה, בדוק את קובץ יומן הרישום. אם קיימת הודעת שגיאה, תקן את השגיאה וחזור על שלב 6.3. אם קיימת בעיה כלשהי לפתרון הבעיה, בקש סיוע באמצעות דף האינטרנט בעיות קלות מעטפת CUTnRUN github (https://github.com/JunwooLee89/Easy-Shells_CUTnRUN/issues).
    הערה: נכון לעכשיו, אינדקסים של Bowtie2 עבור גנומי ייחוס שונים מסופקים באתר Bowtie2 (https://bowtie-bio.sourceforge.net/bowtie2/manual.shtml). משתמשים יכולים לערוך Script_05_bowtie2-index.sh כדי להוריד כל אינדקס Bowtie2 כדי לעמוד בדרישת המשתמש. אם המשתמש אינו יכול לאתר את אינדקס Bowtie2 של גנום הייחוס המעניין, אתר את רצף גנום הייחוס fasta קבצים מתוך:
    1. Ensembl ftp (https://ftp.ensembl.org/pub/current_fasta/)
    2. דף אינטרנט של UCSC (https://hgdownload.soe.ucsc.edu/downloads.html)
    3. או מסדי נתונים ספציפיים אחרים למין.
      לאחר איתור קבצי fasta של רצף גנום הייחוס, צור אינדקס Bowtie2 עבור גנום הייחוס שהורדת על-ידי ביצוע החלק "The bowtie2-build indexer" (https://bowtie-bio.sourceforge.net/bowtie2/manual.shtml#the-bowtie2-build-indexer) באתר Bowtie2.

7. מיפוי ריצוף CUT&RUN חתוך קורא לגנומי הייחוס

  1. פתח את המסוף והקלד הד $SHELL כדי לבדוק את מעטפת ברירת המחדל במסוף הפעיל. אם מעטפת Bash היא מעטפת ברירת המחדל במסוף הנוכחי, המשתמשים עשויים לראות את הפריטים הבאים: /path/to/bash (או הודעה דומה כגון /bin/bash) במסוף.
  2. אם מעטפת ברירת המחדל אינה Bash, הגדר את מעטפת Bash כמעטפת ברירת מחדל על-ידי הקלדת chsh -s $(which bash) בטרמינל. אם המסוף משתמש במעטפת Bash כברירת מחדל, דלג על שלב זה.
  3. הקלד ~/Desktop/Easy-Shells_CUTnRUN/scripts/Script_06_bowtie2-mapping.sh במסוף או גרור את קובץ הסקריפט של המעטפת למסוף והזן.
    הערה: סקריפט מעטפת זה יהיה: (1) הפעל את תוכנית bowtie2 כדי למפות את כל המתאם ואת קבצי fastq גזוז באיכות הן ניסיוני (אנושי; hg19) והן קוצים (שמרים ניצנים; R64-1-1) מתייחסים לגנומים באופן עצמאי. (ii) הפעל את פונקציית תצוגת samtools כדי לדחוס את קבצי זוגות הקריאה הממופים כתבנית BAM. (iii) צור תיקייה אחת (~/Desktop/GSE126612/Bowtie2-mapped) ושמור את קובץ זוגות הקריאה הממופים הדחוסים בתיקייה Bowtie2-maved. (iv) צור תיקייה אחת (~/Desktop/GSE126612/log/bowtie2-mapped) ורשום את יומן תהליך המיפוי כקובץ טקסט bowtie2_log_hg19_SRR-number.txt עבור זוגות קריאה הממופים בגנום הייחוס HG19 ו- bowtie2_log_R64-1-1_SRR-number.txt עבור זוגות קריאה הממופים ב- R64-1-1) כדי לציין את יעילות המיפוי בתיקיית יומן המיפוי Bowtie2.
  4. לאחר השלמת ההפעלה, בדוק את קובץ יומן הרישום. אם קיימת הודעת שגיאה כלשהי בתוך קובץ יומן הרישום, תקן את השגיאה והפעל שוב את קובץ ה-script של המעטפת. אם קיימת בעיה כלשהי לפתרון הבעיה, בקש סיוע באמצעות דף האינטרנט בעיות קלות מעטפת CUTnRUN github (https://github.com/JunwooLee89/Easy-Shells_CUTnRUN/issues).
    הערה: סקריפט מעטפת זה מפעיל עניבת פרפר2 עם אפשרויות למיפוי קבצי רצף זוגיים כדי למצוא זוגות קריאה ממופים בהתאמה עם אורכי מקטעים של 10 bp-700 bp. גלה תיאורי אפשרויות על ידי הקלדת עניבת פפיון2 --עזרה בטרמינל או על ידי ביקור באתר האינטרנט של Bowtie2 (https://bowtie-bio.sourceforge.net/bowtie2/manual.shtml#the-bowtie2-aligner) כדי להבין ולשנות אפשרויות לפי הצורך. השתמש בסקריפט מעטפת זה כדי למפות קובצי fastq אחרים על-ידי שינוי תבנית הנתיב והשם של קובצי fastq ואינדקסי Bowtie2.

8. מיון וסינון קבצי זוגות הקריאה הממופים

  1. פתח את המסוף והקלד הד $SHELL כדי לבדוק את מעטפת ברירת המחדל במסוף הפעיל. אם מעטפת Bash היא מעטפת ברירת המחדל במסוף הנוכחי, המשתמשים עשויים לראות את הפריטים הבאים: /path/to/bash (או הודעה דומה כגון /bin/bash) במסוף.
  2. אם מעטפת ברירת המחדל אינה Bash, הגדר את מעטפת Bash כמעטפת ברירת מחדל על-ידי הקלדת "chsh -s $(which bash)" בטרמינל. אם המסוף משתמש במעטפת Bash כברירת מחדל, דלג על שלב זה.
  3. הקלד ~/Desktop/Easy-Shells_CUTnRUN/scripts/Script_07_filter-sort-bam.sh במסוף או גרור את קובץ הסקריפט של המעטפת למסוף והזן.
    הערה: סקריפט זה יהיה: (i) הפעל את פונקציית תצוגת samtools עבור כל קבצי זוגות הקריאה הממופים הדחוסים בתיקייה ~/Desktop/GSE126612/bowtie2-mapped כדי לסנן זוגות קריאה הממופים באזורי כרומוזומים שאינם קנוניים, רשימה שחורה מבוארת לציבור ואזורים חוזרים של TA. (ii) הפעל את פונקציית המיון samtools כדי למיין את קבצי ה- BAM המסוננים לפי שמות המקטעים או הקואורדינטות באותה ספרייה. (iii) רשום קובץ יומן לכל קובץ bam קלט בספריית ~/Desktop/GSE126612/log/filter-sort-bam .
  4. לאחר השלמת ההפעלה, סקור את קבצי יומן הרישום בקפידה. אם קיימת הודעת שגיאה כלשהי בקבצי יומן הרישום, תקן את השגיאה ונסה להפעיל שוב את קובץ ה- Script של המעטפת. אם קיימת בעיה כלשהי לפתרון הבעיה, בקש סיוע באמצעות דף האינטרנט בעיות קלות מעטפת CUTnRUN github (https://github.com/JunwooLee89/Easy-Shells_CUTnRUN/issues).
    הערה: קבצי ה- bam המתקבלים (פלט) הממוינים לפי שמות המקטעים ישמשו כקבצי קלט ליצירת קבצי BED של פרגמנטים ו- Raw readcounts bedGraph. קבצי bam ממוינים לפי קואורדינטות ישמשו כקבצי קלט ליצירת קבצי BEDPE מקוטעים. כל ה- BED, bedGraph ו- BEDPE ישמשו לשיחות שיא והדמיה בניתוח במורד הזרם. כל קבצי מיטת הביאור עבור אזורי כרומוזומים קנוניים (chr1~22, chrX, chrY ו- chrM), אזורי רשימה שחורה מבוארים לציבור23 ואזורים חוזריםשל TA 18 ממוקמים בספריית ~/Desktop/Easy-Shells_CUTnRUN/blacklist . במידת הצורך, השתמש בספריה זו כדי להוסיף קבצי רשימה שחורה נוספים. השתמש בסקריפט מעטפת זה כדי לבצע פונקציות זהות עבור קבצי BAM של זוגות קריאה ממופים אחרים על-ידי שינוי נתיב ושם קבצי BAM. הקלד samtools view --help and samtools sort --help in terminal לקבלת תיאור נוסף אודות פונקציות אלה.

9. המרת זוגות קריאה ממופים לפיצול קבצי BEDPE, BED ו- Raw readcounts bedGraph

  1. פתח את המסוף והקלד echo $SHELL כדי לבדוק את מעטפת ברירת המחדל במסוף הפעיל. אם מעטפת Bash היא מעטפת ברירת המחדל במסוף הנוכחי, המשתמשים עשויים לראות את הפריטים הבאים: /path/to/bash (או הודעה דומה כגון /bin/bash) במסוף.
  2. אם מעטפת ברירת המחדל אינה Bash, הגדר את מעטפת Bash כמעטפת ברירת מחדל על-ידי הקלדת chsh -s $(which bash) בטרמינל. אם המסוף משתמש במעטפת Bash כברירת מחדל, דלג על שלב זה.
  3. הקלד ~/Desktop/Easy-Shells_CUTnRUN/scripts/Script_08_bam-to-BEDPE-BED-bedGraph.sh במסוף או גרור את קובץ הסקריפט של המעטפת למסוף והזן.
    הערה: סקריפט זה יהיה: (i) הפעל את הפונקציה macs3 filterdup ו - awk כדי להמיר קבצי BAM ממוינים לפי קואורדינטות לפיצול קבצי BEDPE שאורכי הקטע שלהם קצרים מ- 1kb, וישמור את קבצי BEDPE ב - ~/Desktop/GSE126612/BEDPE. (ii) צור ספריית יומן (~/Desktop/GSE126612/log/bam-to-BEDPE) ורשום קובץ יומן לכל קובץ קטעי קריאה ממופה. (iii) הפעל את bedtools bamtobed ו- awk, cut, sort functions כדי להמיר קבצי bam ממוינים לפי שמות מקטעים לקבצי BED מקוטעים שאורכי השברים שלהם קצרים מ- 1 kb. (iv) צור תיקייה אחת (~/Desktop/GSE126612/bam-to-bed) ושמור את קבצי ה-BED המקוטעים בתיקייה bam-to-bed. (v) רשום קובץ יומן לכל מיפוי קורא שברי קובץ BED לספריית יומן (~/Desktop/GSE126612/log/bam-to-bed). (vi) ביצוע פונקציית bedtools genomecov ליצירת קובצי bedGraph גולמיים של ספירות קריאה באמצעות קבצי BED מקוטעים בתיקייה אחת (~/Desktop/GSE126612/bedGraph).
  4. לאחר השלמת ההפעלה, בדוק היטב את קבצי יומן הרישום. אם קיימת בעיה כלשהי לפתרון הבעיה, בקש סיוע באמצעות דף האינטרנט בעיות קלות מעטפת CUTnRUN github (https://github.com/JunwooLee89/Easy-Shells_CUTnRUN/issues).
    הערה: פלט מספרי קריאה גולמיים קבצי bedGraph ישמשו כקבצי קלט עבור תוכנית מתקשר שיא SEACR עם אפשרות נורמליזציה בסעיף 12 ונורמליזציה של ספירת קריאות חלקית בקנה מידה (SFRC)22 בסעיף 10. קבצי BED המקטע ישמשו כקבצי קלט עבור Spike-in מנורמל Reads Per Million mappped reads in the negative Control (SRPMC) normalization24,25 בסעיף 10.To לכידת מקטעים קצרים (>100 bp) רק עבור נתוני CUT&RUN של גורמים הקשורים לכרומטין, שינוי שלב סינון המקטעים בסקריפט זה והמשך בשלב הנורמליזציה. כדי להשוות את אותות CUT&RUN בין מקטעים בגודל קצר ורגיל באותה דגימה, נורמליזציה של SFRC עשויה להיות מועילה להפחתת אפקט הדגימה הפוטנציאלי הנגרם על ידי לכידת מקטעים קצרים בלבד. השתמש בסקריפט מעטפת זה כדי לבצע את אותם תהליכים עבור קבצי BAM ממוינים אחרים בעלי רצף זוגי, על-ידי שינוי תבנית הנתיב והשם של קובצי BAM ו- Bed.

10. המרת קבצי bedGraph של ספירות קריאה גולמיות לקבצי bedGraph ו-bigWig מנורמלים

  1. פתח את המסוף והקלד echo $SHELL כדי לבדוק את מעטפת ברירת המחדל במסוף הפעיל. אם מעטפת Bash היא מעטפת ברירת המחדל במסוף הנוכחי, המשתמשים עשויים לראות את הפריטים הבאים: /path/to/bash (או הודעה דומה כגון /bin/bash) במסוף.
  2. אם מעטפת ברירת המחדל אינה Bash, הגדר את מעטפת Bash כמעטפת ברירת מחדל על-ידי הקלדת chsh -s $(which bash) בטרמינל. אם המסוף משתמש במעטפת Bash כברירת מחדל, דלג על שלב זה.
  3. הקלד ~/Desktop/Easy-Shells_CUTnRUN/scripts/Script_09_normalization_SFRC.sh במסוף או גרור את קובץ הסקריפט של המעטפת למסוף והזן.
    הערה: סקריפט זה נכתב כדי: (i) הפעל for-loop עם פונקציית awk כדי ליצור קבצי bedGraph מנורמלים של SFRC באמצעות קובצי bedGraph של ספירות קריאה גולמיות בתוך ~/Desktop/GSE126612/bedGraph. (ii) הפעל את הפונקציה bedGraphToBigWig כדי ליצור תבנית דחוסה ( .bw) של קבצי bedGraph מנורמלים של SFRC ב - ~/Desktop/GSE126612/bigWig. (iii) רשום קובץ יומן רישום אחד כדי לתעד את גורם הנורמליזציה המשמש לחישוב SFRC לכל ריצה ושמור את קובץ יומן הרישום בתוך ~/Desktop/GSE126612/log/SFRC.
  4. לאחר השלמת ההפעלה, בדוק את קבצי היומן. אם קיימת הודעת שגיאה, תקן את השגיאה והפעל שוב את סקריפט המעטפת. אם קיימת בעיה כלשהי לפתרון הבעיה, בקש סיוע באמצעות דף האינטרנט בעיות קלות מעטפת CUTnRUN github (https://github.com/JunwooLee89/Easy-Shells_CUTnRUN/issues).
    הערה: נעשה שימוש בנורמליזציה של ספירת הקריאה של שברים בקנה מידה בפרסום המקורי22 של ערכת הנתונים GSE126612 CUT&RUN. נוסחת הנורמליזציה בבן i זהה להלן:
    figure-protocol-21618
    מכיוון ששיטת נורמליזציה זו אינה כוללת נורמליזציה עם בקרה שלילית (לדוגמה, דגימת IgG) או בקרת ספייק-אין, גישה זו עשויה שלא להיות אידיאלית לצפייה בהבדלי אותות ברחבי הגנום בין דגימות. עם זאת, מכיוון ששיטה זו דומה תיאורטית לנורמליזציה מבוססת ספירת קריאות כוללת (לדוגמה, ספירה למיליון), יהיה טוב מספיק כדי להבחין בהפרש אותות מקומי בין דגימות.
  5. הקלד ~/Desktop/Easy-Shells_CUTnRUN/scripts/Script_09_normalization_SRPMC.sh במסוף או גרור את קובץ הסקריפט של המעטפת למסוף והזן.
    הערה: סקריפט זה יהיה: (i) לרוץ for-loop עם bedtools genomecov פונקציה כדי ליצור קבצי bedgraph מנורמל SRPMC ~ / שולחן עבודה / GSE126612 / bedGraph באמצעות קטעי BED קבצים ~ / שולחן עבודה / GSE126612 / bam-to-bed. (ii) רשום קובץ יומן רישום כדי לתעד את גורמי הנורמליזציה המשמשים לנורמליזציה של SRPMC לכל ריצה ב - ~/Desktop/GSE126612/log/SRPMC. (iii) הפעל את הפונקציה bedGraphToBigWig כדי ליצור פורמט דחוס ( .bw) של קבצי bedGraph המנורמלים ולשמור את קבצי bigWig המנורמלים בתיקייה ~/Desktop/GSE126612/bigWig .
  6. לאחר השלמת ההפעלה, סקור את קבצי יומן הרישום בקפידה. אם קיימת הודעת שגיאה כלשהי בתוך קבצי יומן הרישום, תקן את השגיאה והפעל שוב את קובץ ה- Script של המעטפת. אם קיימת בעיה כלשהי לפתרון הבעיה, בקש סיוע באמצעות דף האינטרנט בעיות קלות מעטפת CUTnRUN github (https://github.com/JunwooLee89/Easy-Shells_CUTnRUN/issues).
    הערה: הנוסחה של נורמליזציה של SRPMC פותחה כדי לנרמל את ספירת הקריאות בפועל של דגימות הן עם בקרה שלילית (מדגם IgG, לדוגמה) והן עם בקרת ספייק-אין על ידי שילוב RPM (קריאות למיליון קריאות ממופות), RPS (יחס קורא לכל קריאה ספייק-אין) ויחס אות יחסי לשליטה24,25. ההגדרה של RPS זהה להלן:
    figure-protocol-23476
    על-ידי החלת RPS הן עבור מדגם בפועל והן עבור דגימת בקרה שלילית, ניתן לחשב את יחס האות היחסי (RS) לבקרה עבור הדגימה בפועל באופן הבא:
    figure-protocol-23702
    וההגדרה של גורם נורמליזציה RPM (RPM:NF) זהה להלן:
    figure-protocol-23847
    מכאן, גורם הנורמליזציה SRPMC (SRPMC:NF) יצא על ידי שילוב RS ו- RPM:NF יחד:
    figure-protocol-24017
    ונוסחה זו יכולה להיות פשוטה כדלקמן:
    figure-protocol-24148
    לכן, שיטת SRPMC מנרמלת קריאות לפי היחס (1) של קריאות ספייק-אין בין בקרה לדגימה, ו-(2) קריאות בקרה מנורמלות של RPM. מכיוון שגורם נורמליזציה זה מחשיב קריאות ספייק-אין והופך את קריאות הבקרה לדומות בין דגימות יחד, שיטה זו תהיה מתאימה לבחון את ההבדל הגנומי בין הדגימות ולהפחית את אפקט האצווה בסך כל הקריאות של דגימות בפועל ובקרות בניסויי אצווה שונים. קבצי bedGraph מנורמלים אלה יהפכו לקבצי קלט כדי לקרוא לשיאים באמצעות SEACR בסעיף 11. וקבצי bigWig מנורמלים אלה ישמשו בהדמיית אתרים באמצעות IGV ויצירת מפת חום ועלילה ממוצעת באמצעות Deeptools. מומלץ מאוד להשתמש בדפדפן גנום כדי להמחיש את תבנית הנוף של ערכת הנתונים CUT&RUN באמצעות קבצי bigWig מנורמלים באזורים גנומיים מייצגים כדי להעריך את איכות הנתונים. דוגמאות CUT&RUN המציגות תבניות אותות רקע רועשות הדומות לפקד IgG מתאימות ככל הנראה להשמטה לצורך ניתוחים במורד הזרם. השתמש בסקריפטים אלה של מעטפת כדי לנרמל קבצי מיטה אחרים של קריאות וקובצי bedGraph של ספירות קריאה גולמיות על-ידי שינוי הנתיב ושמות הקבצים הן עבור קבצי מיטת קלט ופלט והן עבור קובצי bedgraph. ערוך קבצי Script אלה כדי להחיל חישובי נורמליזציה אחרים על-ידי שינוי הגורמים והנוסחאות בתוך קובץ Script זה.

11. אימות התפלגות גודל הקטע

  1. פתח את המסוף והקלד הד $SHELL כדי לבדוק את מעטפת ברירת המחדל במסוף הפעיל. אם מעטפת Bash היא מעטפת ברירת המחדל במסוף הנוכחי, המשתמשים עשויים לראות את הפריטים הבאים: /path/to/bash (או הודעה דומה כגון /bin/bash) במסוף.
  2. אם מעטפת ברירת המחדל אינה Bash, הגדר את מעטפת Bash כמעטפת ברירת מחדל על-ידי הקלדת chsh -s $(which bash) בטרמינל. אם המסוף משתמש במעטפת Bash כברירת מחדל, דלג על שלב זה.
  3. הקלד ~/Desktop/Easy-Shells_CUTnRUN/scripts/Script_10_insert-size-analysis.sh במסוף או גרור את קובץ הסקריפט של המעטפת למסוף והזן.
    הערה: סקריפט זה נכתב אל: (i) הפעל picard.jar הפונקציה CollectInsertSizeMetrics באמצעות קבצי bam של זוגות קריאה ממופים בתיקייה ~/Desktop/GSE126612/filtered-bam כדי לזהות התפלגות גודל הוספה. (ii) צור תיקייה אחת (~/Desktop/GSE126612/insert-size-distribution) ושמור את תוצאות ניתוח התפלגות גודל ההוספה בתיקייה שנוצרה. (iii) רשום קובץ יומן לכל קובץ bam קלט בתיקייה ~/Desktop/GSE126612/log/insert-size-distribution .
  4. לאחר השלמת ההפעלה, בדוק היטב את קבצי יומן הרישום. אם קיימת הודעת שגיאה כלשהי בתוך קבצי יומן הרישום, תקן את השגיאה ונסה להפעיל שוב את קובץ ה- Script של המעטפת. אם קיימת בעיה כלשהי לפתרון הבעיה, בקש סיוע באמצעות דף האינטרנט בעיות קלות מעטפת CUTnRUN github (https://github.com/JunwooLee89/Easy-Shells_CUTnRUN/issues).
    הערה: באופן כללי, ניתוח גודל ההוספה (פלט) עבור דגימות CUT&RUN מראה שיאים עיקריים בטווחי גודל נוקלאוזומליים מונו- (100-300 bp) ו- di- (300-500 bp). שגיאות/מגבלות טכניות (כגון עיכול יתר/חסר של MNase במהלך הכנת דגימת CUT&RUN או בחירת גודל לא נכונה במהלך הכנת הספרייה) עלולות לגרום להעשרה של אותו או גדול יותר ממקטעים תת-גרעיניים (500-700 bp) וזהים או קצרים יותר ממקטעים תת-גרעיניים (<100 bp). לעיתים היעדר שיאי גודל חד-נוקלאוזומליים עם העשרת המקטעים הארוכים (>500 bp) והקצרים (<100 bp) עשוי לנבוע מטווחי בחירת גודל ספרייה שנבחרו בשלב המעבדה הרטובה, או עומק ריצוף נמוך. השווה את עומק הרצף ('סה"כ רצפים בסיסים' / 'גודל גנום הייחוס הכולל'), סקירה כללית של הנוף הגנומי באמצעות קבצי bigWig מנורמלים של ספירות קריאה בסעיף 10, ותבנית התפלגות גודל הכנס יחד כדי להבהיר את האיכות של דגימות CUT&RUN מעובדות. הקווים המקווקווים בהיסטוגרמות מייצגים את 'השבר המצטבר' של קריאות עם גודל הוספה גדול או שווה לערך בציר x. קו מקווקו זה מאפשר זיהוי התפלגות גדלי הוספה בקובץ קריאות ממופה קלט. התקדמות לאורך ציר x קשורה להגדלת גודל ההוספה. הקו המקווקו מזהה את היחס בין זוגות קריאה ממופים בקובץ bam הקלט שגודל ההוספה שלהם הוא לפחות כמו זה שמצוין במיקום ציר x מצטלב. לכן, הפרשנות מתחילה ב- 1 משמאל, המציינת שלכל הקריאות יש גודל הוספה גדול או שווה לגודל הקטן ביותר, ויורד לכיוון 0 ככל שגודל ההוספה גדל.

12. שיחות שיא באמצעות MACS2, MACS3 ו- SEACR

  1. פתח את המסוף והקלד echo $SHELL כדי לבדוק את מעטפת ברירת המחדל במסוף הפעיל. אם מעטפת Bash היא מעטפת ברירת המחדל במסוף הנוכחי, המשתמשים עשויים לראות את הפריטים הבאים: /path/to/bash (או הודעה דומה כגון /bin/bash) במסוף.
  2. אם מעטפת ברירת המחדל אינה Bash, הגדר את מעטפת Bash כמעטפת ברירת מחדל על-ידי הקלדת chsh -s $(which bash) בטרמינל. אם המסוף משתמש במעטפת Bash כברירת מחדל, דלג על שלב זה.
  3. הקלד ~/Desktop/Easy-Shells_CUTnRUN/scripts/Script_11_peak-calling_MACS.sh במסוף או גרור את קובץ הסקריפט של המעטפת למסוף והזן.
    הערה: סקריפט זה נכתב אל: (i) הפעל פונקציות macs2 callpeak ו - macs3 callpeak עם וללא בקרת IgG באמצעות קבצי BEDPE מקוטעים כדי לקרוא לשיאים ולשמור את תוצאות שיא הקריאה בספריות פלט (~/Desktop/GSE126612/MACS2 ו - ~/Desktop/GSE126612/MACS3). (ii) רשום את היומן של קריאות שיא אלה כקובץ טקסט בספריית יומן הרישום (~/Desktop/GSE126612/log/MACS2 ו - ~/Desktop/GSE126612/log/MACS3)
  4. הקלד ~/Desktop/Easy-Shells_CUTnRUN/scripts/Script_11_peak-calling_SEACR.sh במסוף או גרור את קובץ הסקריפט של המעטפת למסוף והזן.
    הערה: סקריפט זה נכתב כדי: (i) הפעל סקריפט SEACR_1.3.sh עם ובלי פקד IgG, עם אפשרויות מחמירות ורגועות באמצעות ספירת קריאות גולמית bedGraph וקבצי bedGraph מנורמלים כדי לקרוא לשיאים. (ii) צור ספריית פלט (~/Desktop/GSE126612/SEACR-peaks) ושמור את תוצאות שיא הקריאה על-ידי SEACR. (iii) רשום את היומן של קריאות שיא אלה כקובץ טקסט בספריית יומן הרישום (~/Desktop/GSE126612/log/SEACR).
  5. לאחר השלמת הפעלת סקריפטים של מעטפת, בדוק היטב את קבצי יומן הרישום. אם קיימת הודעת שגיאה כלשהי בקבצי יומן הרישום, תקן תחילה את השגיאה. תוכניות מסוימות עשויות שלא לקרוא לשיאים עבור דוגמת פקד IgG עם אפשרות פקד IgG יחד, ולכן להשמיט את הודעת השגיאה לגבי דוגמת פקד IgG עם אפשרות פקד IgG. אם קיימת בעיה כלשהי לפתרון הבעיה, בקש סיוע באמצעות דף האינטרנט בעיות קלות מעטפת CUTnRUN github (https://github.com/JunwooLee89/Easy-Shells_CUTnRUN/issues).
    הערה: שני סקריפטים אלה של מעטפת מבצעים קריאות שיא עבור דוגמאות CUT&RUN באמצעות שלושה מתקשרים לשיא (MACS2, MACS3 ו- SEACR) עם אפשרויות שונות: עם/בלי אפשרות בקרת IgG, שימוש בקבצי bedGraph של ספירות קריאה גולמיות עם אפשרות נורמליזציה של מתקשר שיא או ספירת קריאה מנורמלת bedGraph קבצים ללא אפשרות נורמליזציה של מתקשר שיא, ואפשרויות שיחות שיא SEACR מחמירות ונינוחות. מכיוון שקבצי הפלט של קריאות השיא אינם מספיקים לשימוש ישיר בניתוחים במורד הזרם, Easy Shells CUTnRUN כולל סקריפט אחד לעיבוד קבצי פלט אלה הנקראים פסגות כדי ליצור קבצי שיא חדשים הכוללים כרומוזום, התחלה, סוף ושם פסגות. באמצעות גישות אינטנסיביות של שיחות שיא, Easy Shells CUTnRUN מספק הזדמנות לבחור את תוכנית שיחות השיא המתאימה ביותר לפרויקט CUT&RUN של משתמש על ידי השוואת הפסגות שנקראו על פני שלושה מתקשרים לשיא. בנוסף, צינור ניתוח CUT&RUN זה מספק גם הזדמנות לבחור אפשרויות שיחות שיא המתאימות ביותר לפרויקט CUT&RUN של משתמש. השוואות אלה יבוצעו על ידי דיאגרמת Venn, והדמיה כמפת חום ותרשים ממוצע.

13. יצירת קבצי peak bed נקראים

  1. פתח את המסוף והקלד echo $SHELL כדי לבדוק את מעטפת ברירת המחדל במסוף הפעיל. אם מעטפת Bash היא מעטפת ברירת המחדל במסוף הנוכחי, המשתמשים עשויים לראות את הפריטים הבאים: /path/to/bash (או הודעה דומה כגון /bin/bash) במסוף.
  2. אם מעטפת ברירת המחדל אינה Bash, הגדר את מעטפת Bash כמעטפת ברירת מחדל על-ידי הקלדת chsh -s $(which bash) בטרמינל. אם המסוף משתמש במעטפת Bash כברירת מחדל, דלג על שלב זה.
  3. הקלד ~/Desktop/Easy-Shells_CUTnRUN/scripts/Script_12_make-peak-bed.sh במסוף או גרור את קובץ הסקריפט של המעטפת למסוף והזן.
    הערה: סקריפט זה נכתב אל: (i) הפעל פונקציית awk באמצעות קבצי מיטה בתיקייה ~/Desktop/GSE126612/SEACR כדי ליצור שני סוגים של קבצי מיטת שיא SEACR ~/Desktop/GSE126612/peak-bed_SEACR folder. כל קבצי מיטת השיא כוללים את ההתחלה והסוף של כל פסגה, וקבצי מיטת השיא הממוקדים כוללים את ההתחלה והמיטה של סל האותות הגבוה ביותר בתוך כל פסגה. (ii) הפעל פונקציית awk באמצעות קובצי _peaks.xls בתיקיות ~/Desktop/GSE126612/MACS2 ו - ~/Desktop/GSE126612/MACS3 כדי ליצור קובצי peak bed שלמים הכוללים התחלה וסוף של כל שיא שנקרא על-ידי MACS2 ו- MACS3 בתיקיות ~/Desktop/GSE126612/peak-bed_MACS2 ו - ~/Desktop/GSE126612/peak-bed_MACS3 . (iii) הפעל פונקציית awk באמצעות קובצי _summits.bed בתיקיות ~/Desktop/GSE126612/MACS2 ו - ~/Desktop/GSE126612/MACS3 כדי ליצור קבצי peak bed ממוקדים הכוללים התחלה וסיום של הסל המשמעותי ביותר בכל שיא. (iv) קובצי יומן נכתבים בפורמט קובץ טקסט בתיקייה ~/Desktop/GSE126612/log/peak-bed .
  4. הקלד ~/Desktop/Easy-Shells_CUTnRUN/scripts/Script_13_filter-peaks.sh במסוף או גרור את קובץ הסקריפט של המעטפת למסוף והזן.
    הערה: סקריפט זה נכתב כדי: (i) הפעל פונקציית הצטלבות bedtools באמצעות קובצי peak bed הנקראים ללא אפשרות בקרת IgG כדי להסיר פסגות החופפות לשיאי בקרת IgG. (ii) קובצי מיטת השיא המסוננים נשמרים בתיקיות ~/Desktop/GSE126612/peak-bed-filtered_MACS2, ~/Desktop/GSE126612/peak-bed-filtered_MACS3 ו - ~/Desktop/GSE126612/peak-bed-filtered_SEACR . (iii) קובץ יומן log_filter-peaks.txt נוצר בתיקייה ~/Desktop/GSE126612/log/filter-peaks .
  5. הקלד ~/Desktop/Easy-Shells_CUTnRUN/scripts/Script_14_cat-merge-peak-bed_MACS.sh במסוף או גרור את קובץ הסקריפט של המעטפת למסוף והזן.
    הערה: סקריפט זה נכתב כדי: (i) הפעל פונקציות cat ומיון כדי לשרשר את קבצי מיטת השיא השלמים MACS2 ו- MACS3 של העותקים המשוכפלים כקובץ מיטת שיא אחד ולמיין את קובץ מיטת השיא המשורשר בתיקייה ~/Desktop/GSE126612/bed-for-comparison. (ii) הפעל פונקציית מיזוג bedtools באמצעות קבצי מיטת הפסגות השלמים המשורשרים כדי למזג פסגות החופפות זו לזו. (iii) קובץ יומן log_cat-merged-peak-bed_MACS.txt כתוב בתיקיית יומן ~/Desktop/GSE126612/log/cat-merged-peak-bed.
  6. הקלד ~/Desktop/Easy-Shells_CUTnRUN/scripts/Script_14_cat-merge-peak-bed_SEACR.sh במסוף או גרור את קובץ הסקריפט של המעטפת למסוף והזן.
    הערה: סקריפט זה נכתב כדי: (i) הפעל פונקציות cat ומיון כדי לשרשר את קבצי מיטת השיא השלמים של SEACR של העותקים המשוכפלים כקובץ מיטת שיא אחד ולמיין את קובץ מיטת השיא המשורשר בתיקייה ~/Desktop/GSE126612/bed-for-comparison. (ii) הפעל פונקציית מיזוג bedtools באמצעות קבצי מיטת הפסגות השלמים המשורשרים כדי למזג פסגות החופפות זו לזו. (iii) קובץ יומן log_cat-merged-peak-bed_SEACR.txt כתוב בתיקיית יומן ~/Desktop/GSE126612/log/cat-merged-peak-bed.
  7. לאחר השלמת הפעלת סקריפטי המעטפת, סקור את קבצי יומן הרישום בקפידה. אם קיימת הודעת שגיאה כלשהי בקבצי יומן הרישום, תקן את השגיאה והפעל שוב את קבצי ה-script. אם קיימת בעיה כלשהי לפתרון הבעיה, בקש סיוע באמצעות דף האינטרנט בעיות קלות מעטפת CUTnRUN github (https://github.com/JunwooLee89/Easy-Shells_CUTnRUN/issues).
    הערה: כל קבצי מיטת השיא של אזורי השיא ישמשו כקבצי קלט של ניתוח דיאגרמת חיתוך קבוצות (Venn) כדי להשוות את הדמיון בין אפשרויות קריאת שיא, שיטות קריאת שיא, שכפולים ותצפיות נוף גנומיות ליד אזורי שיא. קבצי מיטת השיא השלמים הממוזגים ישמשו לניתוח רכיבים עיקריים (PC) וניתוח מתאם מקדם פירסון באמצעות כלים עמוקים. קבצי מיטת השיא הממוקדים ישמשו לניתוח מפת חום ותרשים ממוצע באמצעות Deeptools.

14. אימות הדמיון בין העותקים המשוכפלים באמצעות מתאם פירסון וניתוח רכיב ראשי (PC).

  1. פתח את המסוף והקלד echo $SHELL כדי לבדוק את מעטפת ברירת המחדל במסוף הפעיל. אם מעטפת Bash היא מעטפת ברירת המחדל במסוף הנוכחי, המשתמשים עשויים לראות את הפריטים הבאים: /path/to/bash (או הודעה דומה כגון /bin/bash) במסוף.
  2. אם מעטפת ברירת המחדל אינה Bash, הגדר את מעטפת Bash כמעטפת ברירת מחדל על-ידי הקלדת chsh -s $(which bash) בטרמינל. אם המסוף משתמש במעטפת Bash כברירת מחדל, דלג על שלב זה.
  3. הקלד ~/Desktop/Easy-Shells_CUTnRUN/scripts/Script_15_correlation_plotCorrelation.sh במסוף או גרור את קובץ הסקריפט של המעטפת למסוף והזן.
    הערה: סקריפט זה נכתב כדי: (i) הפעל את הפונקציה multiBamSummary BED-file באמצעות קבצי bam של עותקים משוכפלים, שמוינו לפי קואורדינטות, ומיזג קבצי peak bed שלמים עבור CTCF, H3K27Ac ו- RNAPII-S5P כדי ליצור קבצי מטריצה עבור ניתוח מתאם פירסון בתיקייה Desktop/GSE126612/deeptools_multiBamSummary . (ii) הפעל את פונקציית plotCorrelation באמצעות קבצי המטריצה כדי לבצע חישוב מקדם מתאם פירסון ואשכולות מפת חום ולשמור את התוצאה בתיקייה ~/Desktop/GSE126612/deeptools_plotCorrelation . (iii) רשום קובץ יומן log_plotCorrelation.txt בתיקייה ~/Desktop/GSE126612/log/correlation .
  4. הקלד ~/Desktop/Easy-Shells_CUTnRUN/scripts/Script_15_correlation_plotPCA.sh במסוף או גרור את קובץ הסקריפט של המעטפת למסוף והזן.
    הערה: סקריפט זה נכתב כדי: (i) הפעל פונקציית multiBamSummary BEDfile באמצעות קבצי bam, שמוינו לפי קואורדינטות, ומיזגו קבצי peak bed שלמים, הכוללים את כל פסגות CTCF, H3K27ac ו- RNAPII-S5P, כדי ליצור קבצי מטריצה עבור ניתוח רכיבים ראשי (PCA) בתיקיית Desktop/GSE126612/deeptools_multiBamSummary . (ii) הפעל פונקציית plotPCA באמצעות קבצי המטריצה כדי לבצע PCA ולשמור את התוצאה בתיקייה ~/Desktop/GSE126612/deeptools_plotPCA . (iii) רשום קובץ יומן log_plotPCA.txt בתיקייה ~/Desktop/GSE126612/log/correlation .
  5. לאחר השלמת הפעלת סקריפטים של מעטפת, בדוק את קבצי יומן הרישום. אם קיימת הודעת שגיאה כלשהי, תקן את השגיאה והפעל שוב את סקריפטי המעטפת. אם קיימת בעיה כלשהי לפתרון הבעיה, בקש סיוע באמצעות דף האינטרנט בעיות קלות מעטפת CUTnRUN github (https://github.com/JunwooLee89/Easy-Shells_CUTnRUN/issues).
    הערה: באופן עקרוני, עותקים משוכפלים שהוכנו ועובדו כראוי מראים ערכי מקדם מתאם פירסון גבוהים יותר באותה קבוצת אשכולות ומיקום קרוב בניתוח רכיבים עיקריים. כל שכפול, המציג מקדם מתאם פירסון נמוך יותר, ומרחק רב משכפלים אחרים בתרשים הרכיב הראשי, עשוי לייצג חריגה פוטנציאלית בין המשוכפלים. סקריפט מעטפת זה ישים לכל תבנית bam הממופה לקריאת נתונים. שנה את הנתיב ואת שם הקובץ של קבצי bigwig כדי לעמוד בדרישות ספציפיות לפרוייקט.

15. אימות הדמיון בין עותקים משוכפלים, שיטות קריאת שיא ואפשרויות באמצעות דיאגרמת חיתוך קבוצות (Venn)

  1. פתח את המסוף והקלד echo $SHELL כדי לבדוק את מעטפת ברירת המחדל במסוף הפעיל. אם מעטפת Bash היא מעטפת ברירת המחדל במסוף הנוכחי, ייתכן שיש משהו כמו /path/to/bash (לדוגמה, /bin/bash) בטרמינל.
  2. אם מעטפת ברירת המחדל אינה Bash, הגדר את מעטפת Bash כמעטפת ברירת מחדל על-ידי הקלדת chsh -s $(which bash) בטרמינל. אם המסוף משתמש במעטפת Bash כברירת מחדל, שקול לדלג על שלב זה
  3. הקלד ~/Desktop/Easy-Shells_CUTnRUN/scripts/Script_16_venn-diagram_methods.sh במסוף או גרור את קובץ הסקריפט של המעטפת למסוף והזן.
    הערה: סקריפט זה נכתב כדי: (i) הפעל פונקציית התערבות venn באמצעות קבצים שלמים של peak region peak bed כדי למצוא חפיפה בין הפסגות הנקראות על-ידי אפשרויות שונות (עם/בלי אפשרות בקרת IgG, עם/בלי נורמליזציה, ואפשרויות קריאת שיא מחמירות/רגועות עבור SEACR). (ii) צור תיקייה אחת (~/Desktop/GSE126612/intervene_methods) ושמור את תוצאות ניתוח דיאגרמת חיתוך קבוצות (Venn) בתיקייה זו. (iii) רשום קובץ יומן אחד log_intervene_methods.txt בתיקייה ~/Desktop/GSE126612/log/intervention.
  4. הקלד ~/Desktop/Easy-Shells_CUTnRUN/scripts/Script_16_venn-diagram_replicates.sh במסוף או גרור את קובץ הסקריפט של המעטפת למסוף והזן.
    הערה: סקריפט זה נכתב כדי: (i) הפעל את הפונקציה inter venn באמצעות קבצים שלמים של peak region peak bed כדי למצוא חפיפה בין הפסגות של העותקים המשוכפלים. (ii) צור תיקייה אחת (~/Desktop/GSE126612/intervene_replicates) ושמור את תוצאות ניתוח דיאגרמת חיתוך קבוצות (Venn) בתיקייה זו. (iii) רשום קובץ יומן אחד log_intervene_replicates.txt בתיקייה ~/Desktop/GSE126612/log/intervention .
  5. לאחר סיום הפעלת סקריפטי המעטפת, סקור את קבצי יומן הרישום. אם קיימת הודעת שגיאה כלשהי, תקן את השגיאה והפעל שוב את סקריפטי המעטפת. אם קיימת בעיה כלשהי בשימוש בצנרת הניתוח של Easy Shells CUTnRUN, בקש עזרה בדף האינטרנט בעיות של Easy Shells CUTnRUN github (https://github.com/JunwooLee89/Easy-Shells_CUTnRUN/issues).
    הערה: תוצאות ניתוח דיאגרמת חיתוך קבוצות (Venn) אלה מספקות תובנה לבחירת האפשרויות, השיטות והשכפולים המתאימים ביותר לשיחות שיא עם יכולת שחזור גבוהה לניתוח במורד הזרם. ייתכן שעדיף לבחור את האפשרויות והשיטות של שיחות שיא המציגות את מספרי השיא הנקראים הגבוהים ביותר עם חפיפה טובה עם שיטות ואפשרויות אחרות של שיחות שיא.

16. ניתוח מפות חום ומגרשים ממוצעים לדמיין פסגות שנקראות.

  1. פתח את המסוף והקלד הד $SHELL כדי לבדוק את מעטפת ברירת המחדל במסוף הפעיל. אם מעטפת Bash היא מעטפת ברירת המחדל במסוף הנוכחי, ייתכן שיש משהו כמו /path/to/bash (לדוגמה, /bin/bash) בטרמינל.
  2. אם מעטפת ברירת המחדל אינה Bash, הגדר את מעטפת Bash כמעטפת ברירת מחדל על-ידי הקלדת chsh -s $(which bash) בטרמינל. אם המסוף משתמש במעטפת Bash כברירת מחדל, שקול לדלג על שלב זה
  3. הקלד ~/Desktop/Easy-Shells_CUTnRUN/scripts/Script_27_plotHeatmap_focused.sh במסוף או גרור את קובץ הסקריפט של המעטפת למסוף והזן.
    הערה: סקריפט זה נכתב כדי: (i) הפעל פונקציית נקודת התייחסות של computeMatrix באמצעות קבצי bigWig מנורמלים וקבצי peak bed ממוקדים כדי ליצור מטריצות ספירת קריאה מנורמלות במרכז הפסגות הממוקדות בתיקייה ~/Desktop/GSE126612/deeptools_computeMatrix . (ii) הפעל את הפונקציה plotHeatmap באמצעות מטריצת ספירות הקריאה המנורמלות כדי ליצור מפות חום ותרשימים ממוצעים הממחישים תבנית התפלגות ספירת קריאה מנורמלת במיקומי השיא הממוקדים. (iii) צור תיקייה אחת (~/Desktop/GSE126612/deeptools_plotHeatmap) ושמור את קובצי הפלט של plotHeatmap בתיקייה זו. (iv) רשום קובץ יומן אחד log_plotHeatmap_focused.txt בתיקייה ~/Desktop/GSE126612/log/plotHeatmap .
  4. הקלד ~/Desktop/Easy-Shells_CUTnRUN/scripts/Script_27_plotHeatmap_whole.sh במסוף או גרור את קובץ הסקריפט של המעטפת למסוף והזן.
    סקריפט זה נכתב כדי: (i) הפעל פונקציית נקודת התייחסות של computeMatrix באמצעות קבצי bigWig מנורמלים וקבצי peak bed שלמים כדי ליצור מטריצות ספירת קריאה מנורמלות במרכז הפסגות השלמות בתיקייה ~/Desktop/GSE126612/deeptools_computeMatrix . (ii) הפעל את פונקציית plotHeatmap באמצעות מטריצת ספירות הקריאה המנורמלת כדי ליצור מפות חום ותרשימים ממוצעים הממחישים תבנית התפלגות ספירת קריאה מנורמלת בכל מיקומי השיא. (iii) צור תיקייה אחת (~/Desktop/GSE126612/deeptools_plotHeatmap) ושמור את קובצי הפלט של plotHeatmap בתיקייה זו. (iv) רשום קובץ יומן אחד log_plotHeatmap_whole.txt בתיקייה ~/Desktop/GSE126612/log/plotHeatmap .
  5. לאחר סיום הפעלת סקריפטי המעטפת, סקור את קבצי יומן הרישום. אם קיימת הודעת שגיאה כלשהי, תקן את השגיאה והפעל שוב את סקריפטי המעטפת. אם קיימת בעיה כלשהי בשימוש בצנרת הניתוח של Easy Shells CUTnRUN, בקש עזרה בדף האינטרנט בעיות של Easy Shells CUTnRUN github (https://github.com/JunwooLee89/Easy-Shells_CUTnRUN/issues).
    הערה: באופן אידיאלי, מיקומי הפסגות של פסגות MACS2/3 ומיקומי הפסגות הממוקדות של פסגות SEACR מציגים פיזור אותות חד וממוקד במרכז המגרשים. עם זאת, אם אלגוריתם קריאת השיא אינו פועל כראוי עבור נתוני CUT&RUN, התפלגות אות 'רועשת' פחות ממוקדת עשויה להופיע בחלקות. לכן, שימוש במספר הפסגות הנקראות ובדפוסי התפלגות אותות השיא של חלקות הפלט ינחה את קביעת תוקף השיא לניתוח CUT&RUN נוסף הכולל ביאור שיא במורד הזרם.

תוצאות

איכות וחיתוך המתאם שומרים על קריאות באיכות רצף גבוהה
טכניקות ריצוף בתפוקה גבוהה נוטות ליצור שגיאות ריצוף כגון 'מוטציות' רצף בקריאה. יתר על כן, ניתן להעשיר דימרים של מתאם רצף בערכות נתונים של רצף עקב הסרת מתאם לקויה במהלך הכנת הספרייה. שגיאות ריצוף מוגזמות, כגון...

Discussion

היכולת למפות את תפוסת החלבונים על הכרומטין היא בסיסית לביצוע מחקרים מכניסטיים בתחום הביולוגיה של הכרומטין. ככל שמעבדות מאמצות טכניקות מעבדה רטובות חדשות לפרופיל כרומטין, היכולת לנתח נתוני ריצוף מאותם ניסויי מעבדה רטובים הופכת לצוואר בקבוק נפוץ עבור מדעני מעבדה רטובה. ...

Disclosures

המחברים מצהירים כי אינם חושפים.

Acknowledgements

כל הדמויות המאוירות נוצרו עם BioRender.com. CAI מכירה בתמיכה הניתנת באמצעות פרס חוקר הקריירה המוקדמת של הברית לחקר סרטן השחלות, מענק מאיץ של קרן פורבק ופרס המחקר הלאומי לגילוי מוקדם של הברית לסרטן השחלות של מינסטואה.

Materials

NameCompanyCatalog NumberComments
bedGraphToBigWigENCODEhttps://hgdownload.soe.ucsc.edu/admin/exe/Software to compress and convert readcounts bedGraph to bigWig
bedtools-2.31.1The Quinlan Lab @ the U. of Utahhttps://bedtools.readthedocs.io/en/latest/index.htmlSoftware to process bam/bed/bedGraph files
bowtie2 2.5.4Johns Hopkins Universityhttps://bowtie-bio.sourceforge.net/bowtie2/index.shtmlSoftware to build bowtie index and perform alignment
CollectInsertSizeMetrics (Picard)Broad institutehttps://github.com/broadinstitute/picardSoftware to perform insert size distribution analysis
CutadaptNBIShttps://cutadapt.readthedocs.io/en/stable/index.htmlSoftware to perform adapter trimming
Deeptoolsv3.5.1Max Planck Institutehttps://deeptools.readthedocs.io/en/develop/index.htmlSoftware to perform Pearson coefficient correlation analysis, Principal component analysis, and Heatmap/average plot analysis
FastQC Version 0.12.0Babraham Bioinformaticshttps://github.com/s-andrews/FastQCSoftware to check quality of fastq file
Intervenev0.6.1Computational Biology & Gene regulation - Mathelier grouphttps://intervene.readthedocs.io/en/latest/index.htmlSoftware to perform venn diagram analysis using peak files
MACSv2.2.9.1Chan Zuckerberg initiativehttps://github.com/macs3-project/MACS/tree/macs_v2Software to call peaks
MACSv3.0.2Chan Zuckerberg initiativehttps://github.com/macs3-project/MACS/tree/masterSoftware to call peaks
Samtools-1.21Wellcome Sanger Institutehttps://github.com/samtools/samtoolsSoftware to process sam/bam files
SEACRv1.3Howard Hughes Medial institutehttps://github.com/FredHutch/SEACRSoftware to call peaks
SRA Toolkit Release 3.1.1NCBIhttps://github.com/ncbi/sra-toolsSoftware to download SRR from GEO
Trim_Galore v0.6.10Babraham Bioinformaticshttps://github.com/FelixKrueger/TrimGaloreSoftware to perform quality and atapter trimming

References

  1. Hainer, S. J., Fazzio, T. G. High-resolution chromatin profiling using CUT&RUN. Curr Protoc Mol Biol. 126 (1), e85 (2019).
  2. Zhang, Y., et al. Model-based analysis of ChiP-Seq (MACS). Genome Biology. 9 (9), R137 (2008).
  3. Xu, S., Grullon, S., Ge, K., Peng, W. . Stem cell transcriptional networks: Methods and Protocols. , (2014).
  4. Meers, M. P., Tenenbaum, D., Henikoff, S. Peak calling by sparse enrichment analysis for cut&run chromatin profiling. Epigenetics Chromatin. 12 (1), 42 (2019).
  5. Ashburner, M., et al. Gene ontology: Tool for the unification of biology. The gene ontology consortium. Nat Genet. 25 (1), 25-29 (2000).
  6. Harris, M. A., et al. The gene ontology (GO) database and informatics resource. Nucleic Acids Res. 32 (Database issue), D258-D261 (2004).
  7. The Gene Ontology Consortium. The gene ontology resource: 20 years and still going strong. Nucleic Acids Res. 47 (D1), D330-D338 (2019).
  8. Conesa, A., et al. Blast2go: A universal tool for annotation, visualization and analysis in functional genomics research. Bioinformatics. 21 (18), 3674-3676 (2005).
  9. Carbon, S., et al. AmiGO: Online access to ontology and annotation data. Bioinformatics. 25 (2), 288-289 (2009).
  10. Eden, E., Navon, R., Steinfeld, I., Lipson, D., Yakhini, Z. Gorilla: A tool for discovery and visualization of enriched go terms in ranked gene lists. BMC Bioinformatics. 10, 48 (2009).
  11. Huang Da, W., Sherman, B. T., Lempicki, R. A. Bioinformatics enrichment tools: Paths toward the comprehensive functional analysis of large gene lists. Nucleic Acids Res. 37 (1), 1-13 (2009).
  12. Huang Da, W., Sherman, B. T., Lempicki, R. A. Systematic and integrative analysis of large gene lists using david bioinformatics resources. Nat Protoc. 4 (1), 44-57 (2009).
  13. Ge, S. X., Jung, D., Yao, R. ShinyGO: A graphical gene-set enrichment tool for animals and plants. Bioinformatics. 36 (8), 2628-2629 (2020).
  14. Tang, D., et al. SRplot: A free online platform for data visualization and graphing. PLoS One. 18 (11), e0294236 (2023).
  15. Ramírez, F., et al. Deeptools2: A next generation web server for deep-sequencing data analysis. Nucleic Acids Res. 44 (W1), W160-W165 (2016).
  16. Robinson, J. T., et al. Integrative genomics viewer. Nat Biotechnol. 29 (1), 24-26 (2011).
  17. Kent, W. J., et al. The human genome browser at ucsc. Genome Res. 12 (6), 996-1006 (2002).
  18. Yu, F., Sankaran, V. G., Yuan, G. -. C. CUT&RUNTools 2.0: A pipeline for single-cell and bulk-level CUT&RUN and CUT&Tag data analysis. Bioinformatics. 38 (1), 252-254 (2021).
  19. Zhu, Q., Liu, N., Orkin, S. H., Yuan, G. -. C. CUT&RUNTools: A flexible pipeline for CUT&RUN processing and footprint analysis. Genome Biol. 20 (1), 192 (2019).
  20. . Nf-core/cutandrun: Nf-core/cutandrun v3.2.2 iridium ibis Available from: https://github.com/nf-core/cutandrun/tree/3.2.2 (2024)
  21. Kong, N. R., Chai, L., Tenen, D. G., Bassal, M. A. A modified CUT&RUN protocol and analysis pipeline to identify transcription factor binding sites in human cell lines. STAR Protoc. 2 (3), 100750 (2021).
  22. Meers, M. P., Bryson, T. D., Henikoff, J. G., Henikoff, S. Improved CUT&RUN chromatin profiling tools. eLife. 8, e46314 (2019).
  23. Amemiya, H. M., Kundaje, A., Boyle, A. P. The encode blacklist: Identification of problematic regions of the genome. Sci Rep. 9 (1), 9354 (2019).
  24. Deberardine, M. BRgenomics for analyzing high-resolution genomics data in R. Bioinformatics. 39 (6), btad331 (2023).
  25. Deberardine, M., Booth, G. T., Versluis, P. P., Lis, J. T. The nelf pausing checkpoint mediates the functional divergence of cdk9. Nat Commun. 14 (1), 2762 (2023).
  26. Krueger, F., James, F. O., Ewels, P. A., Afyounian, E., Schuster-Boeckler, B. . FelixKrueger/TrimGalore: v0.6.7 - DOI via Zenodo. , (2021).
  27. . Easy bam downsampling Available from: https://davemcg.github.io/post/easy-bam-downsampling/ (2018)
  28. . Positionbaseddownsamplesam (picard) Available from: https://gatk.broadinstitute.org/hc/en-us/articles/360041850311-PositionBasedDownsampleSam-Picard (2020)

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Explore More Articles

214CUT RUNDNA

This article has been published

Video Coming Soon

JoVE Logo

Privacy

Terms of Use

Policies

Research

Education

ABOUT JoVE

Copyright © 2025 MyJoVE Corporation. All rights reserved