ملاحظة: تتوفر معلومات عن ملفات CUT&RUN fastq في GSE126612 في الجدول 1. وترد المعلومات المتعلقة بتطبيقات البرمجيات المستخدمة في هذه الدراسة في جدول المواد.
1. تنزيل خط أنابيب Easy-Shells_CUTnRUN من صفحة Github الخاصة به
- افتح المحطة من نظام التشغيل.
ملاحظة: إذا لم يكن المستخدم متأكدا من كيفية فتح الجهاز الطرفي في macOS و Windows ، فراجع صفحة الويب هذه (https://discovery.cs.illinois.edu/guides/System-Setup/terminal/). بالنسبة لنظام التشغيل Linux ، راجع صفحة الويب هذه (https://www.geeksforgeeks.org/how-to-open-terminal-in-linux/).
- قم بتنزيل مسار التحليل المضغوط من Github عن طريق كتابة wget https://github.com/JunwooLee89/Easy-Shells_CUTnRUN/archive/refs/heads/main.zip -O ~ / Desktop / Easy-Shells_CUTnRUN.zip في المحطة الطرفية.
- بعد تنزيل الملف المضغوط ، قم بفك ضغط الملف المضغوط الذي تم تنزيله عن طريق كتابة فك الضغط ~ / Desktop / Easy-Shells_CUTnRUN.zip -d ~ / Desktop / في الجهاز الطرفي.
- بعد فك الضغط ، احذف الملف المضغوط عن طريق كتابة rm ~ / Desktop / Easy-Shells_CUTnRUN.zip في الجهاز وقم بتغيير اسم المجلد عن طريق كتابة mv ~ / Desktop / Easy-Shells_CUTnRUN-master ~ / Desktop / Easy-Shells_CUTnRUN.
- بعد إزالة الملف المضغوط ، اكتب chmod + x ~ / Desktop / Easy-Shells_CUTnRUN / script / * .sh في الجهاز لتعيين الإذن القابل للتنفيذ لجميع البرامج النصية shell داخل دليل العمل. من الآن فصاعدا ، ما عليك سوى كتابة المسار واسم البرامج النصية shell هذه في المحطة الطرفية أو سحب البرامج النصية إلى المحطة الطرفية والدخول لتشغيل البرامج النصية shell هذه في المحطة الطرفية.
ملاحظة: عادة ما يتم تثبيت Bash shell مسبقا على معظم توزيعات Linux. ومع ذلك، لم تعد إصدارات macOS الحديثة توفر Bash shell المثبت مسبقا. إذا لم يكن النظام يحتوي على Bash ، فقم بتثبيت Bash shell أولا. قم بزيارة الروابط أدناه للحصول على إرشادات تصف كيفية تثبيت Bash shell في نظام التشغيل Linux (https://ioflood.com/blog/install-bash-shell-linux/) و macOS (https://www.cs.cornell.edu/courses/cs2043/2024sp/styled-3/#:~:text=The%20first%20thing%20you%20will,you%20will%20see%20the%20following:). تتم كتابة هذه البرامج النصية خطوة بخطوة لإنشاء مجلد واحد ~ / Desktop / GSE126612 لإجراء معظم تحليل CUT &RUN هذا داخل هذا الدليل دون الحاجة إلى التعديل. إذا كان المستخدم يفهم كيفية استخدام البرامج النصية shell هذه ، فيمكن للمستخدمين مراجعة وتخصيص البرامج النصية shell هذه لتحليل مجموعات بيانات CUT &RUN الأخرى وتعديل الخيارات وفقا للاحتياجات الخاصة بالمشروع. لقراءة البرامج النصية shell هذه وتحريرها، ضع في اعتبارك استخدام Visual studio Code (https://code.visualstudio.com/) كخيار واحد لبرنامج سهل الاستخدام متوفر لأنظمة التشغيل الرئيسية.
2. تثبيت البرامج المطلوبة ل Easy Shells CUTnRUN
- من بين البرامج النصية shell التي تحمل اسم Script_01_installation_***.sh ، اكتشف البرنامج النصي shell الذي يتضمن الاسم نوع نظام التشغيل لنظام المستخدم. حاليا ، يدعم Easy Shells CUTnRUN البرنامج النصي للتثبيت للأنظمة المستندة إلى macOS و Debian / Ubuntu و CentOS / RPM .
- افتح الجهاز واكتب echo $SHELL للتحقق من الغلاف الافتراضي في الطرف النشط. إذا كان Bash shell هو الغلاف الافتراضي في المحطة الطرفية الحالية، فقد يرى المستخدمون ما يلي: /path/to/bash (أو رسالة مماثلة مثل /bin/bash) في المحطة الطرفية.
- إذا لم تكن الغلاف الافتراضي هي Bash، فقم بتعيين Bash shell كغلاف افتراضي عن طريق كتابة chsh -s $(which bash) في المحطة الطرفية. إذا كانت المحطة الطرفية تستخدم Bash shell كإعداد افتراضي، فتخط هذه الخطوة.
- في الجهاز الطرفي ، قم بتشغيل البرنامج النصي لغلاف التثبيت عن طريق كتابة ~ / Desktop / Easy-Shells_CUTnRUN / scripts / Script_01_installation_*** .sh أو اسحب ملف البرنامج النصي shell إلى الجهاز الطرفي وأدخله.
- اقرأ ملف Test_README.md في مجلد /path/to/SEACR-1.3/Testfiles. اتبع التعليمات الموجودة داخل ملف README لتوضيح ما إذا كان SEACR في نظام المستخدم يعمل بشكل صحيح.
ملاحظة: من الأهمية بمكان التحقق من صحة وظيفة SEACR باستخدام ملفات الاختبار التي تقدمها صفحة SEACR Github للحصول على نتائج استدعاء الذروة المناسبة من بيانات CUT & RUN. لذلك ، اتبع تعليمات Test_README.md في /path/to/SEACR-1.3/Testfiles مباشرة بعد تثبيت SEACR. على الرغم من أن Easy Shells يوفر CUTnRUN برامج نصية لهيكل التثبيت لبعض أنظمة التشغيل ، إلا أن هذه البرامج النصية قد لا تعمل في نظام بعض المستخدمين لتثبيت جميع البرامج المطلوبة ل Easy Shells CUTnRUN. إذا كانت هناك أي مشكلة في التثبيت، فراجع موقع الويب الأصلي للبرنامج الذي تم إلغاء تثبيته، أو اطلب المساعدة باستخدام صفحة ويب مشكلات Easy Shells CUTnRUN github (https://github.com/JunwooLee89/Easy-Shells_CUTnRUN/issues).
3. تنزيل مجموعة بيانات CUT &RUN المتاحة للجمهور من Sequence Read Archive (SRA)
- افتح الجهاز واكتب echo $SHELL للتحقق من الغلاف الافتراضي في الطرف النشط. إذا كان Bash shell هو الغلاف الافتراضي في المحطة الطرفية الحالية، فقد يرى المستخدمون ما يلي: /path/to/bash (أو رسالة مماثلة مثل /bin/bash) في المحطة الطرفية.
- إذا لم تكن الغلاف الافتراضي هي Bash، فقم بتعيين Bash shell كغلاف افتراضي عن طريق كتابة chsh -s $(which bash) في المحطة الطرفية. إذا كانت المحطة الطرفية تستخدم Bash shell كإعداد افتراضي، فتخط هذه الخطوة.
- اكتب ~ / Desktop / Easy-Shells_CUTnRUN / scripts / Script_02_download-fastq.sh في الجهاز الطرفي أو اسحب ملف البرنامج النصي shell إلى الجهاز وأدخله.
ملاحظة: سيقوم هذا البرنامج النصي بما يلي: (i) إنشاء مجلد واحد (~ / Desktop / GSE126612 / fastq) وتنزيل قائمة بملفات SRA المكتوبة في ملف نصي (~ / Desktop / Easy-Shells_CUTnRUN / sample_info / SRR_list.txt) داخل مجلد fastq. على سبيل المثال ، يتضمن SRR_list.txt ملفات fastq لمجموعة فرعية من عينات GSE126612 CUT &RUN. (ii) قم بتنزيل ملفات fastq الأولية داخل مجلد fastq. (iii) قم بإنشاء مجلد واحد (~/Desktop/GSE126612/log/fastq) وقم بتدوين ملف سجل (download-fastq_log.txt) وملف معلومات عينة تم تنزيله (SRR_list_info.txt) داخل مجلد السجل هذا.
- بعد تشغيل البرنامج النصي ، تحقق من ملف السجل. إذا كانت هناك أي رسالة خطأ داخل ملف السجل، فقم بإصلاح الخطأ وحاول الخطوة 3.3 مرة أخرى. إذا كانت هناك أي مشكلة لحل المشكلة ، فاطلب المساعدة في صفحة ويب مشكلات Easy Shells CUTnRUN github (https://github.com/JunwooLee89/Easy-Shells_CUTnRUN/issues).
ملاحظة: لتسهيل ممارسة خط أنابيب تحليل CUT &RUN هذا ، يتم استرداد العينات التالية المتاحة للجمهور من SRA: عينة واحدة من التحكم الوهمي (IgG) ، وثلاث عينات من بنية الكروماتين وبروتين عامل النسخ (CTCF) ، وأربع عينات تتوافق مع علامة هيستون "نشطة" (H3K27Ac) ، وثلاث عينات تتوافق مع مناطق بدء النسخ التي تميز ببوليميراز الحمض النووي الريبي II (RNAPII-S5P). تم إجراء التسلسل كنهاية مزدوجة ، لذلك يتم إقران ملفين لكل عينة.
4. فحص الجودة الأولي لملفات التسلسل الخام
- افتح الجهاز واكتب echo $SHELL للتحقق من الغلاف الافتراضي في الطرف النشط. إذا كان Bash shell هو الغلاف الافتراضي في المحطة الطرفية الحالية، فقد يرى المستخدمون ما يلي: /path/to/bash (أو رسالة مماثلة مثل /bin/bash) في المحطة الطرفية.
- إذا لم تكن الغلاف الافتراضي هي Bash، فقم بتعيين Bash shell كغلاف افتراضي عن طريق كتابة chsh -s $(which bash) في المحطة الطرفية. إذا كانت المحطة الطرفية تستخدم Bash shell كإعداد افتراضي، فتخط هذه الخطوة.
- اكتب ~/Desktop/Easy-Shells_CUTnRUN/scripts/Script_03_fastQC.sh في الجهاز الطرفي أو اسحب البرنامج النصي shell إلى الجهاز الطرفي وأدخله.
ملاحظة: سيقوم البرنامج النصي shell هذا: (i) بتشغيل برنامج FastQC لجميع ملفات fastq الأولية في المجلد ~/Desktop/GSE126612/fastq وحفظ ملفات تقرير التحقق من الجودة في المجلد ~/Desktop/GSE126612/fastqc.1st . (ii) اكتب ملف سجل (fastqc.1st.log.SRR-number.txt) لكل تشغيل FastQC في مجلد سجل (~/Desktop/GSE126612/log/fastqc.1st).
- بعد الانتهاء من تشغيل البرنامج النصي shell ، راجع ملف السجل لتوضيح نجاح التشغيل. إذا كانت هناك أي رسالة خطأ داخل ملف السجل، فقم بتصحيح الخطأ وكرر الخطوة 4.3. إذا كانت هناك أي مشكلة لحل المشكلة، فاطلب المساعدة باستخدام صفحة ويب مشكلات Easy Shells CUTnRUN github (https://github.com/JunwooLee89/Easy-Shells_CUTnRUN/issues).
ملاحظة: من بين ملفات الإخراج ، تتضمن ملفات fastqc.html نتائج فحص جودة سهلة الاستخدام. إذا كانت هناك مشكلة (مشكلات) شديدة في الجودة ، فناقش مع زملائه في المعلوماتية الحيوية لتحديد مدى ملاءمة البيانات لتحليل المصب. يتم استخدام تقارير مراقبة الجودة المماثلة لتأكيد جودة البيانات المحسنة بعد تشذيب المحول. لاستخدام هذا البرنامج النصي لمجموعات البيانات الأخرى، قم بتحرير مسار دلائل العمل والإخراج لتلبية احتياجات المستخدم. يتمثل الاختلاف الملحوظ عند تفسير مراقبة الجودة ل CUT &RUN مقارنة بقراءات ChIP-seq في أن القراءات المكررة في CUT & RUN لا تشير بالضرورة إلى تكرارات PCR. وذلك لأن MNase المجند سوف يهضم في نفس المواقع أو مواقع مماثلة داخل المجموعات التجريبية.
5. تشذيب الجودة والمحول لملفات التسلسل الخام
- افتح الجهاز واكتب echo $SHELL للتحقق من الغلاف الافتراضي في الطرف النشط. إذا كان Bash shell هو الغلاف الافتراضي في المحطة الطرفية الحالية، فقد يرى المستخدمون ما يلي: /path/to/bash (أو رسالة مماثلة مثل /bin/bash) في المحطة الطرفية.
- إذا لم تكن الغلاف الافتراضي هي Bash، فقم بتعيين Bash shell كغلاف افتراضي عن طريق كتابة chsh -s $(which bash) في المحطة الطرفية. إذا كانت المحطة الطرفية تستخدم Bash shell كإعداد افتراضي، فتخط هذه الخطوة.
- اكتب ~/Desktop/Easy-Shells_CUTnRUN/scripts/Script_04_trimming.sh في الجهاز الطرفي أو اسحب البرنامج النصي Script_04_trimming.sh إلى الجهاز وأدخله.
ملاحظة: سيقوم البرنامج النصي shell هذا: (i) بتشغيل برنامج Trim-Galore لجميع ملفات fastq الأولية في ~/Desktop/GSE126612/fastq لإجراء تشذيب المحول والجودة. (ii) قم بإنشاء مجلد واحد (~ / سطح المكتب / GSE126612 / trimmed) واحفظ ملفات إخراج Trim-Galore داخل المجلد المقتطع. (iii) قم بإنشاء مجلد سجل واحد (~/Desktop/GSE126612/log/trim_galore) وقم بتدوين ملف سجل trim_galore_log_RSS-number.txt لكل تشغيل Trim-Abundant.
- بعد الانتهاء من التشغيل، راجع ملف السجل بعناية. إذا كانت هناك أي رسالة خطأ داخل ملف السجل، فقم بتصحيح الخطأ وكرر الخطوة 5.3. إذا كانت هناك أي مشكلة لحل المشكلة، فاطلب المساعدة باستخدام صفحة ويب مشكلات Easy Shells CUTnRUN github (https://github.com/JunwooLee89/Easy-Shells_CUTnRUN/issues).
- بعد الانتهاء من هذه العملية ، قارن ملفات الإخراج .html بملفات fastqc.html التي تم إنشاؤها في 4.3. قم بمراجعة مسار دلائل الإدخال والإخراج لتنفيذ خطوة التشذيب لأي ملفات fastq موجودة في مكان آخر.
6. تنزيل فهرس bowtie2 للجينومات المرجعية لعينات التحكم الفعلية والمرتفعة
- افتح الجهاز واكتب echo $SHELL للتحقق من الغلاف الافتراضي في الطرف النشط. إذا كان Bash shell هو الغلاف الافتراضي في المحطة الطرفية الحالية، فقد يرى المستخدمون ما يلي: /path/to/bash (أو رسالة مماثلة مثل /bin/bash) في المحطة الطرفية.
- إذا لم تكن الغلاف الافتراضي هي Bash، فقم بتعيين Bash shell كغلاف افتراضي عن طريق كتابة chsh -s $(which bash) في المحطة الطرفية. إذا كانت المحطة الطرفية تستخدم Bash shell كإعداد افتراضي، فتخط هذه الخطوة.
- اكتب ~ / Desktop / Easy-Shells_CUTnRUN / scripts / Script_05_bowtie2-index.sh في الجهاز الطرفي أو اسحب البرنامج النصي shell إلى الجهاز وأدخله.
ملاحظة: سيقوم هذا البرنامج النصي بما يلي: (أنا) تنزيل فهارس Bowtie2 للجينومات المرجعية الفعلية للعينة (الإنسان ؛ hg19 ؛ المستخدمة في المنشور الأصلي22) والجينومات المرجعية للتحكم في Spike-in (الخميرة الناشئة. R64-1-1) في مجلد فهرس bowtie2 (~ / سطح المكتب / سهل Shells_CUTnRUN / bowtie2-index). (iii) اكتب ملف سجل (bowtie2-index-log.txt) في دليل سجل (~ / Desktop / GSE126612 / log / bowtie2-index).
- بعد الانتهاء من التشغيل، تحقق من ملف السجل. إذا كانت هناك أي رسالة خطأ، فقم بتصحيح الخطأ وكرر الخطوة 6.3. إذا كانت هناك أي مشكلة لحل المشكلة، فاطلب المساعدة باستخدام صفحة ويب مشكلات Easy Shells CUTnRUN github (https://github.com/JunwooLee89/Easy-Shells_CUTnRUN/issues).
ملاحظة: حاليا ، يتم توفير فهارس Bowtie2 لجينومات مرجعية مختلفة في موقع Bowtie2 (https://bowtie-bio.sourceforge.net/bowtie2/manual.shtml). يمكن للمستخدمين تحرير Script_05_bowtie2-index.sh لتنزيل أي فهرس Bowtie2 لتلبية متطلبات المستخدم. إذا لم يتمكن المستخدم من تحديد موقع فهرس Bowtie2 للجينوم المرجعي محل الاهتمام ، فحدد موقع تسلسل الجينوم المرجعي ملفات fasta من:- فرقة ftp (https://ftp.ensembl.org/pub/current_fasta/)
- صفحة الويب الخاصة بجامعة كاليفورنيا (https://hgdownload.soe.ucsc.edu/downloads.html)
- أو قواعد بيانات أخرى خاصة بالأنواع.
بعد تحديد موقع تسلسل الجينوم المرجعي ملفات fasta ، قم بإنشاء فهرس Bowtie2 للجينوم المرجعي الذي تم تنزيله باتباع قسم "مفهرس بناء bowtie2" (https://bowtie-bio.sourceforge.net/bowtie2/manual.shtml#the-bowtie2-build-indexer) من موقع Bowtie2 على الويب.
7. رسم خرائط القراءة المشذبة لتسلسل CUT & RUN إلى الجينومات المرجعية
- افتح الجهاز واكتب echo $SHELL للتحقق من الغلاف الافتراضي في الطرف النشط. إذا كان Bash shell هو الغلاف الافتراضي في المحطة الطرفية الحالية، فقد يرى المستخدمون ما يلي: /path/to/bash (أو رسالة مماثلة مثل /bin/bash) في المحطة الطرفية.
- إذا لم تكن الغلاف الافتراضي هي Bash، فقم بتعيين Bash shell كغلاف افتراضي عن طريق كتابة chsh -s $(which bash) في المحطة الطرفية. إذا كانت المحطة الطرفية تستخدم Bash shell كإعداد افتراضي، فتخط هذه الخطوة.
- اكتب ~ / Desktop / Easy-Shells_CUTnRUN / scripts / Script_06_bowtie2-mapping.sh في الجهاز الطرفي أو اسحب ملف البرنامج النصي shell إلى الجهاز وأدخله.
ملاحظة: سيقوم البرنامج النصي shell هذا: (1) بتشغيل برنامج bowtie2 لتعيين جميع ملفات المحول وملفات fastq المشذبة بالجودة لكل من التحكم التجريبي (البشري ؛ hg19) والتحكم في الارتفاع (الخميرة الناشئة. R64-1-1) الجينومات المرجعية بشكل مستقل. (ii) قم بتشغيل وظيفة عرض samtools لضغط ملفات أزواج القراءة المعينة بتنسيق BAM. (ثالثا) قم بإنشاء مجلد واحد (~ / سطح المكتب / GSE126612 / bowtie2-mapped) واحفظ ملف أزواج القراءة المضغوطة المعينة داخل المجلد المعين bowtie2. (رابعا) قم بإنشاء مجلد واحد (~ / Desktop / GSE126612 / log / bowtie2-mapped) واكتب سجل عملية التعيين كملف نصي bowtie2_log_hg19_SRR-number.txt لأزواج القراءة المعينة على الجينوم المرجعي hg19 و bowtie2_log_R64-1-1_SRR-number.txt لأزواج القراءة المعينة على R64-1-1) للإشارة إلى كفاءة رسم الخرائط داخل مجلد سجل رسم الخرائط bowtie2.
- بعد الانتهاء من التشغيل، تحقق من ملف السجل. إذا كانت هناك أي رسالة خطأ داخل ملف السجل ، فقم بتصحيح الخطأ وتشغيل البرنامج النصي shell مرة أخرى. إذا كانت هناك أي مشكلة لحل المشكلة، فاطلب المساعدة باستخدام صفحة ويب مشكلات Easy Shells CUTnRUN github (https://github.com/JunwooLee89/Easy-Shells_CUTnRUN/issues).
ملاحظة: يقوم البرنامج النصي shell هذا بتشغيل bowtie2 مع خيارات لتعيين ملفات التسلسل المزدوجة للعثور على أزواج قراءة معينة بشكل متسق بأطوال أجزاء 10 نقطة أساس - 700 نقطة أساس. اكتشف أوصاف الخيارات عن طريق كتابة ربطة العنق 2 - المساعدة في المحطة أو من خلال زيارة موقع ربطة العنق 2 (https://bowtie-bio.sourceforge.net/bowtie2/manual.shtml#the-bowtie2-aligner) لفهم الخيارات وتغييرها حسب الحاجة. استخدم البرنامج النصي shell هذا لتعيين أي ملفات fastq أخرى عن طريق تغيير تنسيق المسار والاسم لملفات fastq وفهارس Bowtie2.
8. فرز وتصفية ملفات أزواج القراءة المعينة
- افتح الجهاز واكتب echo $SHELL للتحقق من الغلاف الافتراضي في الطرف النشط. إذا كان Bash shell هو الغلاف الافتراضي في المحطة الطرفية الحالية، فقد يرى المستخدمون ما يلي: /path/to/bash (أو رسالة مماثلة مثل /bin/bash) في المحطة الطرفية.
- إذا لم يكن الغلاف الافتراضي هو Bash، فقم بتعيين Bash shell كغلاف افتراضي عن طريق كتابة "chsh -s $(which bash)" في المحطة الطرفية. إذا كانت المحطة الطرفية تستخدم Bash shell كإعداد افتراضي، فتخط هذه الخطوة.
- اكتب ~ / Desktop / Easy-Shells_CUTnRUN / scripts / Script_07_filter-sort-bam.sh في الجهاز الطرفي أو اسحب ملف البرنامج النصي shell إلى الجهاز وأدخله.
ملاحظة: سيقوم هذا البرنامج النصي بما يلي: (i) تشغيل وظيفة عرض samtools لجميع ملفات زوج القراءة المعينة المضغوطة في مجلد ~/Desktop/GSE126612/bowtie2-mappped لتصفية أزواج القراءة المعينة في مناطق الكروموسوم غير الأساسية والقائمة السوداء المشروحة علنا ومناطق تكرار TA. (ii) قم بتنفيذ وظيفة فرز samtools لفرز ملفات bam التي تمت تصفيتها حسب أسماء الأجزاء أو الإحداثيات داخل نفس الدليل. (iii) اكتب ملف سجل لكل ملف إدخال bam في دليل ~ / Desktop / GSE126612 / log / filter-sort-bam .
- بعد الانتهاء من التشغيل، راجع ملفات السجل بعناية. إذا كانت هناك أي رسالة خطأ في ملفات السجل ، فقم بتصحيح الخطأ وحاول تشغيل البرنامج النصي shell مرة أخرى. إذا كانت هناك أي مشكلة لحل المشكلة، فاطلب المساعدة باستخدام صفحة ويب مشكلات Easy Shells CUTnRUN github (https://github.com/JunwooLee89/Easy-Shells_CUTnRUN/issues).
ملاحظة: ستعمل ملفات bam الناتجة (الإخراج) التي تم فرزها حسب أسماء الأجزاء كملفات إدخال لإنشاء ملفات BED وملفات bedGraph لعدد القراءات الخام. ستعمل ملفات bam التي تم فرزها حسب الإحداثيات كملفات إدخال لإنشاء ملفات BEDPE مجزأة. سيتم استخدام جميع BED و bedGraph و BEDPE لاستدعاء الذروة والتصور في التحليل النهائي. توجد جميع ملفات سرير التعليقات التوضيحية لمناطق الكروموسوم المتعارف عليها (chr1 ~ 22 و chrX و chrY و chrM) ومناطق القائمة السوداء المشروحةعلنا 23 ومناطق تكرار TA18 في دليل ~ / Desktop / Easy-Shells_CUTnRUN / blacklist . إذا لزم الأمر، استخدم هذا الدليل لإضافة ملفات إضافية في القائمة السوداء. استخدم هذا البرنامج النصي shell لأداء نفس الوظائف لأزواج القراءة الأخرى المعينة وملفات bam عن طريق تغيير المسار واسم ملفات bam. اكتب samtools view --help و samtools sort --help في terminal لمزيد من الوصف حول هذه الوظائف.
9. تحويل أزواج القراءة المعينة إلى أجزاء ملفات bedpe و BED و readcounts bedGraph
- افتح الجهاز واكتب echo $SHELL للتحقق من الغلاف الافتراضي في الطرف النشط. إذا كان Bash shell هو الغلاف الافتراضي في المحطة الطرفية الحالية، فقد يرى المستخدمون ما يلي: /path/to/bash (أو رسالة مماثلة مثل /bin/bash) في المحطة الطرفية.
- إذا لم تكن الغلاف الافتراضي هي Bash، فقم بتعيين Bash shell كغلاف افتراضي عن طريق كتابة chsh -s $(which bash) في المحطة الطرفية. إذا كانت المحطة الطرفية تستخدم Bash shell كإعداد افتراضي، فتخط هذه الخطوة.
- اكتب ~ / Desktop / Easy-Shells_CUTnRUN / scripts / Script_08_bam-to-BEDPE-BED-bedGraph.sh في الجهاز الطرفي أو اسحب ملف البرنامج النصي shell إلى الجهاز وأدخله.
ملاحظة: سيقوم هذا البرنامج النصي بما يلي: (i) تشغيل macs3 filterdup ووظيفة awk لتحويل ملفات bam التي تم فرزها حسب الإحداثيات لتقطيع ملفات BEDPE التي تكون أطوال الأجزاء منها أقصر من 1 كيلو بايت ، وحفظ ملفات BEDPE في ~ / Desktop / GSE126612 / BEDPE. (ii) إنشاء دليل سجل (~/Desktop/GSE126612/log/bam-to-BEDPE) وكتابة ملف سجل لكل ملف أجزاء يقرأ معين. (ثالثا) قم بتشغيل وظائف bedtools bamtobed و awk و cut و sort لتحويل ملفات bam التي تم فرزها حسب أسماء الأجزاء إلى تجزئة ملفات BED التي تكون أطوال الأجزاء منها أقصر من 1 كيلو بايت. (رابعا) قم بإنشاء مجلد واحد (~ / سطح المكتب / GSE126612 / bam إلى السرير) وحفظ ملفات BED المجزأة داخل مجلد bam-to-bed. (v) اكتب ملف سجل لكل جزء من القراءة المعينة لملف BED في دليل سجل (~ / Desktop / GSE126612 / log / bam-to-bed). (سادسا) تنفيذ وظيفة genomecov أدوات السرير لإنشاء ملفات bedGraph الخام باستخدام ملفات BED المجزأة في مجلد واحد (~ / Desktop / GSE126612 / bedGraph).
- بعد الانتهاء من التشغيل ، تحقق من ملفات السجل بعناية. إذا كانت هناك أي مشكلة لحل المشكلة، فاطلب المساعدة باستخدام صفحة ويب مشكلات Easy Shells CUTnRUN github (https://github.com/JunwooLee89/Easy-Shells_CUTnRUN/issues).
ملاحظة: سيتم استخدام ملفات bedGraph لعمليات القراءة الأولية للإخراج كملفات إدخال لبرنامج المتصل ذو الذروة SEACR مع خيار التسوية في القسم 12 وتطبيع عدد القراءات الجزئي المقلم (SFRC)22 في القسم 10. ستعمل ملفات BED المجزأة كملفات إدخال لقراءة Spike-in المعادية لكل مليون قراءة معينة في تطبيع التحكم السلبي (SRPMC)24،25 في القسم 10.To التقاط الأجزاء القصيرة (>100 نقطة أساس) فقط لبيانات CUT &RUN للعوامل المرتبطة بالكروماتين ، وتغيير خطوة ترشيح الأجزاء في هذا البرنامج النصي ومتابعة خطوة التطبيع. لمقارنة إشارات CUT & RUN بين الأجزاء ذات الحجم القصير والمنتظم داخل نفس العينة ، قد يكون تطبيع SFRC مفيدا لتقليل تأثير أخذ العينات المحتملة الناجم عن التقاط الأجزاء القصيرة فقط. استخدم البرنامج النصي shell هذا لتنفيذ نفس العمليات لملفات bam المصنفة المتسلسلة الأخرى المزدوجة عن طريق تغيير تنسيق المسار والاسم لملفات bam و bed.
10. تحويل ملفات bedGraph الأولية إلى ملفات bedGraph و bigWig الطبيعية
- افتح الجهاز واكتب echo $SHELL للتحقق من الغلاف الافتراضي في الطرف النشط. إذا كان Bash shell هو الغلاف الافتراضي في المحطة الطرفية الحالية، فقد يرى المستخدمون ما يلي: /path/to/bash (أو رسالة مماثلة مثل /bin/bash) في المحطة الطرفية.
- إذا لم تكن الغلاف الافتراضي هي Bash، فقم بتعيين Bash shell كغلاف افتراضي عن طريق كتابة chsh -s $(which bash) في المحطة الطرفية. إذا كانت المحطة الطرفية تستخدم Bash shell كإعداد افتراضي، فتخط هذه الخطوة.
- اكتب ~ / Desktop / Easy-Shells_CUTnRUN / scripts / Script_09_normalization_SFRC.sh في الجهاز الطرفي أو اسحب ملف البرنامج النصي shell إلى الجهاز وأدخله.
ملاحظة: تمت كتابة هذا البرنامج النصي إلى: (i) Run for-loop with awk function لإنشاء ملفات bedGraph المعادية ل SFRC باستخدام ملفات bedGraph الأولية في ~/Desktop/GSE126612/bedGraph. (ii) قم بتنفيذ وظيفة bedGraphToBigWig لإنشاء تنسيق مضغوط (.bw) لملفات bedGraph المطبعة ل SFRC في ~ / Desktop / GSE126612 / bigWig. (iii) اكتب ملف سجل واحد لتسجيل عامل التطبيع المستخدم لحساب SFRC لكل تشغيل وحفظ ملف السجل داخل ~ / Desktop / GSE126612 / log / SFRC.
- بعد الانتهاء من التشغيل، تحقق من ملفات السجل. إذا كانت هناك أي رسالة خطأ ، فقم بتصحيح الخطأ وقم بتشغيل البرنامج النصي shell مرة أخرى. إذا كانت هناك أي مشكلة لحل المشكلة، فاطلب المساعدة باستخدام صفحة ويب مشكلات Easy Shells CUTnRUN github (https://github.com/JunwooLee89/Easy-Shells_CUTnRUN/issues).
ملاحظة: تم استخدام تطبيع عدد القراءة الكسري المقاس في المنشورالأصلي 22 من مجموعة بيانات CUT &RUN GSE126612. صيغة التطبيع في bin i هي نفسها كما يلي:

نظرا لأن طريقة التطبيع هذه لا تتضمن التطبيع مع التحكم السلبي (على سبيل المثال ، عينة IgG) ولا التحكم في الارتفاع ، فقد لا يكون هذا النهج مثاليا لمراقبة اختلاف الإشارة على مستوى الجينوم بين العينات. ومع ذلك ، نظرا لأن هذه الطريقة متشابهة نظريا مع التطبيع الآخر القائم على إجمالي عمليات القراءة (على سبيل المثال ، العد لكل مليون) ، فسيكون من الجيد بما يكفي ملاحظة اختلاف الإشارة المحلية بين العينات.
- اكتب ~ / Desktop / Easy-Shells_CUTnRUN / scripts / Script_09_normalization_SRPMC.sh في الجهاز أو اسحب ملف البرنامج النصي shell إلى الجهاز وأدخله.
ملاحظة: سيقوم هذا البرنامج النصي بما يلي: (i) تشغيل for-loop مع وظيفة genomecov bedtools لإنشاء ملفات bedgraph طبيعية SRPMC في ~ / Desktop / GSE126612 / bedGraph باستخدام ملفات BED المجزأة في ~ / Desktop / GSE126612 / bam إلى السرير. (ii) تدوين ملف سجل لتسجيل عوامل التطبيع المستخدمة لتطبيع SRPMC لكل تشغيل في ~/Desktop/GSE126612/log/SRPMC. (iii) قم بتنفيذ وظيفة bedGraphToBigWig لإنشاء تنسيق مضغوط (.bw) لملفات bedGraph الطبيعية وحفظ ملفات bigWig الطبيعية في مجلد ~ / Desktop / GSE126612 / bigWig .
- بعد الانتهاء من التشغيل، راجع ملفات السجل بعناية. إذا كانت هناك أي رسالة خطأ داخل ملفات السجل ، فقم بتصحيح الخطأ وتشغيل البرنامج النصي shell مرة أخرى. إذا كانت هناك أي مشكلة لحل المشكلة، فاطلب المساعدة باستخدام صفحة ويب مشكلات Easy Shells CUTnRUN github (https://github.com/JunwooLee89/Easy-Shells_CUTnRUN/issues).
ملاحظة: تم تطوير صيغة تطبيع SRPMC لتطبيع عدد قراءات العينة الفعلية مع كل من التحكم السلبي (عينة IgG ، على سبيل المثال) والتحكم في الارتفاع من خلال الجمع بين عامل تطبيع RPM (يقرأ لكل مليون قراءة معينة) و RPS (نسبة القراءة لكل قراءة سبايك) ونسبة الإشارة النسبية للتحكم24،25. تعريف RPS هو نفسه كما يلي:

من خلال تطبيق RPS لكل من العينة الفعلية وعينة التحكم السالبة ، يمكن حساب نسبة الإشارة النسبية (RS) للتحكم في العينة الفعلية على النحو التالي:

وتعريف عامل تطبيع RPM (RPM: NF) هو نفسه على النحو التالي:

من هنا ، ظهر عامل تطبيع SRPMC (SRPMC: NF) من خلال الجمع بين RS و RPM: NF معا:

ويمكن تبسيط هذه الصيغة على النحو التالي:

لذلك ، تعمل طريقة SRPMC على تطبيع القراءات من خلال (1) نسبة قراءات الارتفاع بين التحكم والعينة ، و (2) قراءات التحكم الطبيعية RPM نظرا لأن عامل التطبيع هذا يأخذ في الاعتبار قراءات الارتفاع ويجعل قراءات التحكم قابلة للمقارنة بين العينات معا ، فستكون هذه الطريقة مناسبة لمراقبة الفرق على مستوى الجينوم بين العينات وتقليل تأثير الدفعة في إجمالي القراءات للعينات الفعلية والضوابط في تجارب الدفعات المختلفة. ستصبح ملفات bedGraph المعادية هذه ملفات إدخال لاستدعاء القمم باستخدام SEACR في القسم 11. وسيتم استخدام ملفات bigWig المعادية هذه في تصور المواقع من خلال IGV وإنشاء خريطة حرارية ومؤامرة متوسطة عبر Deeptools. يقترح بشدة استخدام متصفح الجينوم لتصور نمط المشهد لمجموعة بيانات CUT & RUN باستخدام ملفات bigWig الطبيعية في المناطق الجينومية التمثيلية لتقييم جودة البيانات. من المحتمل أن تكون عينات CUT&RUN التي تعرض أنماط إشارة خلفية صاخبة تشبه عنصر تحكم IgG مناسبة لحذفها للتحليلات النهائية استخدم البرامج النصية shell هذه لتطبيع ملفات bedGraph وعمليات القراءة الأخرى وملفات bedGraph الأولية عن طريق تغيير أسماء المسار والملفات لكل من ملفات سرير الإدخال والإخراج وbedgraph. قم بتحرير هذه البرامج النصية لتطبيق حسابات التسوية الأخرى عن طريق تغيير العوامل والصيغة داخل هذا البرنامج النصي.
11. التحقق من صحة توزيع حجم القطعة
- افتح الجهاز واكتب echo $SHELL للتحقق من الغلاف الافتراضي في الطرف النشط. إذا كان Bash shell هو الغلاف الافتراضي في المحطة الطرفية الحالية، فقد يرى المستخدمون ما يلي: /path/to/bash (أو رسالة مماثلة مثل /bin/bash) في المحطة الطرفية.
- إذا لم تكن الغلاف الافتراضي هي Bash، فقم بتعيين Bash shell كغلاف افتراضي عن طريق كتابة chsh -s $(which bash) في المحطة الطرفية. إذا كانت المحطة الطرفية تستخدم Bash shell كإعداد افتراضي، فتخط هذه الخطوة.
- اكتب ~ / Desktop / Easy-Shells_CUTnRUN / scripts / Script_10_insert-size-analysis.sh في الجهاز أو اسحب ملف البرنامج النصي shell إلى الجهاز وأدخله.
ملاحظة: تمت كتابة هذا البرنامج النصي إلى: (i) تشغيل picard.jar الدالة CollectInsertSizeMetrics باستخدام ملفات bam لأزواج القراءة المعينة في مجلد ~/Desktop/GSE126612/filtered-bam لتحديد توزيع حجم الإدراج. (ii) قم بإنشاء مجلد واحد (~/Desktop/GSE126612/insert-size-distribution) وحفظ نتائج تحليل توزيع حجم الإدراج في المجلد الذي تم إنشاؤه. (ثالثا) اكتب ملف سجل لكل ملف إدخال bam في مجلد ~ / Desktop / GSE126612 / log / insert-size-distribution .
- بعد الانتهاء من التشغيل ، تحقق من ملفات السجل بعناية. إذا كانت هناك أي رسالة خطأ داخل ملفات السجل ، فقم بتصحيح الخطأ وحاول تشغيل البرنامج النصي shell مرة أخرى. إذا كانت هناك أي مشكلة لحل المشكلة، فاطلب المساعدة باستخدام صفحة ويب مشكلات Easy Shells CUTnRUN github (https://github.com/JunwooLee89/Easy-Shells_CUTnRUN/issues).
ملاحظة: بشكل عام ، يظهر تحليل حجم الإدراج (الإخراج) لعينات CUT &RUN قمم رئيسية عند نطاقات حجم النواة أحادية (100-300 نقطة أساس) و ثنائي (300-500 نقطة أساس). يمكن أن تتسبب الأخطاء / القيود الفنية (مثل الإفراط في / نقص هضم MNase أثناء تحضير عينة CUT &RUN أو اختيار الحجم غير الصحيح أثناء إعداد المكتبة) في إثراء نفس أو أكبر من ثلاثي النوكليosomal (500-700 نقطة أساس) ونفس أو أقصر من شظايا النوكليosomi الفرعية (<100 نقطة أساس). في بعض الأحيان ، قد يكون عدم وجود قمم أحادية الحجم أحادية النواة مع إثراء الأجزاء الطويلة (>500 نقطة أساس) والقصيرة (<100 نقطة أساس) بسبب نطاقات اختيار حجم المكتبة المختارة في مرحلة المختبر الرطب ، أو عمق التسلسل المنخفض. قارن عمق التسلسل ("إجمالي القواعد المتسلسلة" / "إجمالي حجم الجينوم المرجعي") ، ونظرة عامة على المشهد الجينومي باستخدام ملفات bigWig المقروضة المطبعة في القسم 10 ، ونمط توزيع حجم الإدراج معا لتوضيح جودة عينات CUT &RUN المعالجة. تمثل الخطوط المتقطعة في الرسوم البيانية "الكسر التراكمي" للقراءات بحجم إدراج أكبر من أو يساوي القيمة الموجودة على المحور السيني. يتيح هذا الخط المتقطع تحديد توزيع أحجام الإدراج في ملف القراءات المعينة للإدخال. يرتبط التقدم على طول المحور x بزيادة حجم الإدراج. يحدد الخط المتقطع نسبة أزواج القراءة المعينة في ملف bam المدخل التي لها حجم إدراج لا يقل عن حجمه المشار إليه في موضع المحور x المتقاطع. لذلك ، يبدأ التفسير عند 1 على اليسار ، مما يشير إلى أن جميع القراءات لها حجم إدخال أكبر من أو يساوي أصغر حجم ، وينخفض نحو 0 مع زيادة حجم الإدراج.
12. استدعاء القمم باستخدام MACS2 و MACS3 و SEACR
- افتح الجهاز واكتب echo $SHELL للتحقق من الغلاف الافتراضي في الطرف النشط. إذا كان Bash shell هو الغلاف الافتراضي في المحطة الطرفية الحالية، فقد يرى المستخدمون ما يلي: /path/to/bash (أو رسالة مماثلة مثل /bin/bash) في المحطة الطرفية.
- إذا لم تكن الغلاف الافتراضي هي Bash، فقم بتعيين Bash shell كغلاف افتراضي عن طريق كتابة chsh -s $(which bash) في المحطة الطرفية. إذا كانت المحطة الطرفية تستخدم Bash shell كإعداد افتراضي، فتخط هذه الخطوة.
- اكتب ~/Desktop/Easy-Shells_CUTnRUN/scripts/Script_11_peak-calling_MACS.sh في الجهاز الطرفي أو اسحب ملف البرنامج النصي shell إلى الجهاز وأدخله.
ملاحظة: تمت كتابة هذا البرنامج النصي إلى: (i) تشغيل وظائف macs2 callpeak و macs3 مع وبدون تحكم IgG باستخدام ملفات BEDPE المجزأة لاستدعاء الذروة وحفظ نتائج استدعاء الذروة في دلائل الإخراج (~/Desktop/GSE126612/MACS2 و ~/Desktop/GSE126612/MACS3). (ii) اكتب سجل استدعاءات الذروة هذه كملف نصي في دليل السجل (~/Desktop/GSE126612/log/MACS2 و ~/Desktop/GSE126612/log/MACS3)
- اكتب ~ / Desktop / Easy-Shells_CUTnRUN / scripts / Script_11_peak-calling_SEACR.sh في الجهاز أو اسحب ملف البرنامج النصي shell إلى الجهاز وأدخله.
ملاحظة: تمت كتابة هذا البرنامج النصي إلى: (i) تشغيل البرنامج النصي SEACR_1.3.sh مع عنصر تحكم IgG وبدونه، مع خيارات صارمة ومريحة باستخدام redcounts readcounts الأولية bedGraph وملفات bedGraph الطبيعية لاستدعاء القممة. (ii) إنشاء دليل الإخراج (~/Desktop/GSE126612/SEACR-peaks) وحفظ نتائج استدعاء الذروة بواسطة SEACR. (ثالثا) اكتب سجل استدعاءات الذروة هذه كملف نصي في دليل السجل (~ / Desktop / GSE126612 / log / SEACR).
- بعد الانتهاء من تشغيل البرامج النصية shell ، تحقق من ملفات السجل بعناية. إذا كانت هناك أي رسالة خطأ في ملفات السجل ، فقم بتصحيح الخطأ أولا. قد لا تستدعي بعض البرامج الذروة لعينة التحكم IgG مع خيار التحكم IgG معا ، وبالتالي ، احذف رسالة الخطأ المتعلقة بعينة تحكم IgG مع خيار التحكم IgG. إذا كانت هناك أي مشكلة لحل المشكلة، فاطلب المساعدة باستخدام صفحة ويب مشكلات Easy Shells CUTnRUN github (https://github.com/JunwooLee89/Easy-Shells_CUTnRUN/issues).
ملاحظة: يقوم هذان النصان النصيان الشبكيان بإجراء استدعاء الذروة لعينات CUT &RUN باستخدام ثلاثة متصلين بالذروة (MACS2 و MACS3 و SEACR) مع خيارات متنوعة: مع / بدون خيار التحكم IgG ، باستخدام ملفات bedGraph لعمليات القراءة الأولية مع خيار التطبيع لذروة المتصل أو ملفات bedGraph المقيدة بالعدد الطبيعي بدون خيار التطبيع لمتصل الذروة ، وخيارات استدعاء ذروة SEACR الصارمة والمريحة. نظرا لأن ملفات إخراج استدعاء الذروة ليست كافية لاستخدامها مباشرة في تحليلات المصب ، فإن Easy Shells يتضمن CUTnRUN برنامجا نصيا واحدا لمعالجة ملفات إخراج الذروة المسماة لإنشاء ملفات ذروة جديدة تتضمن الكروموسوم والبدء والنهاية واسم القمم. من خلال مناهج مكالمات الذروة المكثفة ، توفر Easy Shells CUTnRUN فرصة لاختيار برنامج الاتصال الذروة الأنسب لمشروع CUT &RUN للمستخدم من خلال مقارنة القمم التي يتم استدعاؤها عبر ثلاثة متصلين بالذروة. بالإضافة إلى ذلك ، يوفر خط أنابيب تحليل CUT &RUN هذا أيضا فرصة لتحديد خيارات الاتصال الذروة الأنسب لمشروع CUT &RUN للمستخدم. سيتم إجراء هذه المقارنات عن طريق مخطط Venn ، والتصور كخريطة حرارية ومخطط متوسط.
13. إنشاء ملفات سرير الذروة
- افتح الجهاز واكتب echo $SHELL للتحقق من الغلاف الافتراضي في الطرف النشط. إذا كان Bash shell هو الغلاف الافتراضي في المحطة الطرفية الحالية، فقد يرى المستخدمون ما يلي: /path/to/bash (أو رسالة مماثلة مثل /bin/bash) في المحطة الطرفية.
- إذا لم تكن الغلاف الافتراضي هي Bash، فقم بتعيين Bash shell كغلاف افتراضي عن طريق كتابة chsh -s $(which bash) في المحطة الطرفية. إذا كانت المحطة الطرفية تستخدم Bash shell كإعداد افتراضي، فتخط هذه الخطوة.
- اكتب ~ / Desktop / Easy-Shells_CUTnRUN / scripts / Script_12_make-peak-bed.sh في الجهاز الطرفي أو اسحب ملف البرنامج النصي shell إلى الجهاز وأدخله.
ملاحظة: تمت كتابة هذا البرنامج النصي إلى: (i) تشغيل وظيفة awk باستخدام ملفات السرير في المجلد ~ / Desktop / GSE126612 / SEACR لإنشاء نوعين من ملفات ذروة السرير SEACR ~ / سطح المكتب / GSE126612 / peak-bed_SEACR . تتضمن ملفات سرير الذروة بأكملها بداية ونهاية كل ذروة ، وتتضمن ملفات سرير الذروة المركزة بداية وسرير أعلى صندوق إشارة داخل كل ذروة. (ii) قم بتشغيل وظيفة awk باستخدام ملفات _peaks.xls في مجلدات ~ / Desktop / GSE126612 / MACS2 و ~ / Desktop / GSE126612 / MACS3 لإنشاء ملفات ذروة كاملة تتضمن بداية ونهاية كل ذروة يتم استدعاؤها بواسطة MACS2 و MACS3 في مجلدات ~ / Desktop / GSE126612 / peak-bed_MACS2 و ~ / Desktop / GSE126612 / peak-bed_MACS3 . (iii) قم بتشغيل وظيفة awk باستخدام ملفات _summits.bed في مجلدات ~ / Desktop / GSE126612 / MACS2 و ~ / Desktop / GSE126612 / MACS3 لإنشاء ملفات ذروة مركزة تتضمن بداية ونهاية الحاوية الأكثر أهمية داخل كل ذروة. (iv) تتم كتابة ملفات السجل بتنسيق ملف نصي في مجلد ~ / Desktop / GSE126612 / log / peak-bed .
- اكتب ~ / Desktop / Easy-Shells_CUTnRUN / scripts / Script_13_filter-peaks.sh في الجهاز الطرفي أو اسحب ملف البرنامج النصي shell إلى الجهاز وأدخله.
ملاحظة: تمت كتابة هذا البرنامج النصي إلى: (i) تشغيل وظيفة تقاطع bedtools باستخدام ملفات ذروة السرير التي يتم استدعاؤها بدون خيار التحكم IgG لإزالة القمم المتداخلة مع قمم التحكم IgG. (ii) يتم حفظ ملفات ذروة السرير التي تمت تصفيتها في مجلدات ~ / Desktop / GSE126612 / peak-bed-filtered_MACS2 و ~ / Desktop / GSE126612 / peak-bed-filtered_MACS3 و ~ / Desktop / GSE126612 / peak-bed-filtered_SEACR . (iii) يتم إنشاء ملف سجل log_filter-peaks.txt في مجلد ~ / Desktop / GSE126612 / log / filter-peaks .
- اكتب ~ / Desktop / Easy-Shells_CUTnRUN / scripts / Script_14_cat-merge-peak-bed_MACS.sh في الجهاز الطرفي أو اسحب ملف البرنامج النصي shell إلى الجهاز وأدخله.
ملاحظة: تمت كتابة هذا البرنامج النصي إلى: (i) تشغيل وظائف cat والفرز لتسلسل ملفات ذروة السرير MACS2 و MACS3 بالكامل للنسخ المتماثلة كملف سرير ذروة واحد وفرز ملف سرير الذروة المتسلسل في مجلد ~/Desktop/GSE126612/bed-for-comparison. (ii) قم بتشغيل وظيفة دمج أدوات السرير باستخدام ملفات سرير الذروة الكاملة المتسلسلة لدمج القمم التي تتداخل مع بعضها البعض. (iii) تمت كتابة log_cat-merged-peak-bed_MACS.txt ملف السجل في مجلد السجل ~ / Desktop / GSE126612 / log / cat-merged-peak-bed.
- اكتب ~ / Desktop / Easy-Shells_CUTnRUN / scripts / Script_14_cat-merge-peak-bed_SEACR.sh في الجهاز أو اسحب ملف البرنامج النصي shell إلى الجهاز وأدخله.
ملاحظة: تمت كتابة هذا البرنامج النصي إلى: (i) تشغيل وظائف cat والفرز لتسلسل ملفات سرير الذروة الكاملة SEACR للنسخ المتماثلة كملف سرير ذروة واحد وفرز ملف سرير الذروة المتسلسل في مجلد ~/Desktop/GSE126612/bed-for-comparison. (ii) قم بتشغيل وظيفة دمج أدوات السرير باستخدام ملفات سرير الذروة الكاملة المتسلسلة لدمج القمم التي تتداخل مع بعضها البعض. (iii) تمت كتابة log_cat-merged-peak-bed_SEACR.txt ملف السجل في مجلد السجل ~ / Desktop / GSE126612 / log / cat-merged-peak-bed.
- بعد الانتهاء من تشغيل البرامج النصية shell ، راجع ملفات السجل بعناية. إذا كانت هناك أي رسالة خطأ في ملفات السجل ، فقم بتصحيح الخطأ وتشغيل البرنامج النصي (البرامج النصية) مرة أخرى. إذا كانت هناك أي مشكلة لحل المشكلة، فاطلب المساعدة باستخدام صفحة ويب مشكلات Easy Shells CUTnRUN github (https://github.com/JunwooLee89/Easy-Shells_CUTnRUN/issues).
ملاحظة: سيتم استخدام ملفات ذروة طبقات الذروة بأكملها كملفات إدخال لتحليل مخطط Venn لمقارنة التشابه بين خيارات استدعاء الذروة وطرق استدعاء الذروة والتكرارات وملاحظات المناظر الطبيعية الجينومية بالقرب من مناطق الذروة. سيتم استخدام ملفات ذروة مناطق الذروة المدمجة بالكامل لتحليل المكون الرئيسي (PC) وتحليل ارتباط معامل بيرسون باستخدام الأدوات العميقة. سيتم استخدام ملفات ذروة السرير المركزة لخريطة الحرارة وتحليل متوسط المؤامرة باستخدام Deeptools.
14. التحقق من صحة التشابه بين التكرارات باستخدام ارتباط بيرسون وتحليل المكون الرئيسي (PC).
- افتح الجهاز واكتب echo $SHELL للتحقق من الغلاف الافتراضي في الطرف النشط. إذا كان Bash shell هو الغلاف الافتراضي في المحطة الطرفية الحالية، فقد يرى المستخدمون ما يلي: /path/to/bash (أو رسالة مماثلة مثل /bin/bash) في المحطة الطرفية.
- إذا لم تكن الغلاف الافتراضي هي Bash، فقم بتعيين Bash shell كغلاف افتراضي عن طريق كتابة chsh -s $(which bash) في المحطة الطرفية. إذا كانت المحطة الطرفية تستخدم Bash shell كإعداد افتراضي، فتخط هذه الخطوة.
- اكتب ~ / Desktop / Easy-Shells_CUTnRUN / scripts / Script_15_correlation_plotCorrelation.sh في الجهاز الطرفي أو اسحب ملف البرنامج النصي shell إلى الجهاز وأدخله.
ملاحظة: تمت كتابة هذا البرنامج النصي إلى: (i) تشغيل وظيفة multiBamSummary BED-file باستخدام ملفات bam للنسخ المتماثلة ، والتي تم فرزها حسب الإحداثيات ، ودمج ملفات ذروة السرير بالكامل ل CTCF و H3K27Ac و RNAPII-S5P لإنشاء ملفات مصفوفة لتحليل ارتباط Pearson في مجلد سطح المكتب / GSE126612 / deeptools_multiBamSummary . (ii) قم بتشغيل وظيفة plotCorrelation باستخدام ملفات المصفوفة لإجراء حساب معامل ارتباط Pearson وتجميع خريطة التمثيل اللوني وحفظ النتيجة في مجلد ~ / Desktop / GSE126612 / deeptools_plotCorrelation . (ثالثا) اكتب ملف سجل log_plotCorrelation.txt في مجلد ~ / Desktop / GSE126612 / log / correlation .
- اكتب ~ / Desktop / Easy-Shells_CUTnRUN / scripts / Script_15_correlation_plotPCA.sh في الجهاز أو اسحب ملف البرنامج النصي shell إلى الجهاز وأدخله.
ملاحظة: تمت كتابة هذا البرنامج النصي إلى: (i) تشغيل وظيفة multiBamSummary BED-file باستخدام ملفات bam ، التي تم فرزها حسب الإحداثيات ، ودمج ملفات ذروة السرير بالكامل ، والتي تتضمن جميع قمم CTCF و H3K27ac و RNAPII-S5P ، لإنشاء ملفات مصفوفة لتحليل المكون الرئيسي (PCA) في مجلد سطح المكتب / GSE126612 / deeptools_multiBamSummary . (ii) قم بتشغيل وظيفة plotPCA باستخدام ملفات المصفوفة لأداء PCA وحفظ النتيجة في مجلد ~ / Desktop / GSE126612 / deeptools_plotPCA . (iii) اكتب ملف سجل log_plotPCA.txt في مجلد ~ / Desktop / GSE126612 / log / correlation .
- بعد الانتهاء من تشغيل البرامج النصية shell ، تحقق من ملفات السجل. إذا كانت هناك أي رسالة خطأ ، فقم بتصحيح الخطأ وقم بتشغيل البرامج النصية shell مرة أخرى. إذا كانت هناك أي مشكلة لحل المشكلة، فاطلب المساعدة باستخدام صفحة ويب مشكلات Easy Shells CUTnRUN github (https://github.com/JunwooLee89/Easy-Shells_CUTnRUN/issues).
ملاحظة: من حيث المبدأ، تظهر النسخ المتماثلة المعدة والمعالجة بشكل صحيح قيم معامل ارتباط بيرسون أعلى داخل نفس مجموعة التجميع وتحديد المواقع القريبة في تحليل المكون الرئيسي. قد يمثل أي تكرار ، يظهر معامل ارتباط بيرسون أقل ، ومسافة طويلة من التكرارات الأخرى في مخطط المكون الرئيسي ، متطرفا محتملا بين التكرارات. ينطبق البرنامج النصي shell هذا على أي بيانات قراءة بتنسيق bam معينة. قم بتغيير المسار واسم الملف للملفات الكبيرة لتلبية المتطلبات الخاصة بالمشروع.
15. التحقق من صحة التشابه بين النسخ المتماثلة وطرق استدعاء الذروة والخيارات باستخدام مخطط Venn
- افتح الجهاز واكتب echo $SHELL للتحقق من الغلاف الافتراضي في الطرف النشط. إذا كان Bash shell هو الغلاف الافتراضي في المحطة الطرفية الحالية، فقد يكون هناك شيء مثل /path/to/bash (على سبيل المثال، /bin/bash) في المحطة الطرفية.
- إذا لم تكن الغلاف الافتراضي هي Bash، فقم بتعيين Bash shell كغلاف افتراضي عن طريق كتابة chsh -s $(which bash) في المحطة الطرفية. إذا كانت المحطة الطرفية تستخدم Bash shell كافتراضي ، ففكر في تخطي هذه الخطوة
- اكتب ~ / Desktop / Easy-Shells_CUTnRUN / scripts / Script_16_venn-diagram_methods.sh في الجهاز الطرفي أو اسحب ملف البرنامج النصي shell إلى الجهاز وأدخله.
ملاحظة: تمت كتابة هذا البرنامج النصي إلى: (i) تشغيل وظيفة التدخل venn باستخدام ملفات ذروة طبقة الذروة بأكملها للعثور على التداخلات بين القمم التي يتم استدعاؤها بواسطة خيارات مختلفة (مع/بدون خيار التحكم IgG، مع/بدون تطبيع، وخيارات استدعاء الذروة الصارمة/المريحة ل SEACR). (ii) قم بإنشاء مجلد واحد (~/Desktop/GSE126612/intervene_methods) واحفظ نتائج تحليل مخطط Venn في هذا المجلد. (iii) اكتب log_intervene_methods.txt ملف سجل واحد في مجلد ~ / Desktop / GSE126612 / log / intervention .
- اكتب ~ / Desktop / Easy-Shells_CUTnRUN / scripts / Script_16_venn-diagram_replicates.sh في الجهاز الطرفي أو اسحب ملف البرنامج النصي shell إلى الجهاز وأدخله.
ملاحظة: تمت كتابة هذا البرنامج النصي إلى: (i) تشغيل الدالة inter venn باستخدام ملفات ذروة منطقة الذروة بأكملها للعثور على التداخلات بين قمم النسخ المتماثلة. (ii) قم بإنشاء مجلد واحد (~/Desktop/GSE126612/intervene_replicates) واحفظ نتائج تحليل مخطط Venn في هذا المجلد. (iii) اكتب log_intervene_replicates.txt ملف سجل واحد في مجلد ~ / Desktop / GSE126612 / log / intervention .
- بعد الانتهاء من تشغيل البرامج النصية shell ، راجع ملفات السجل. إذا كانت هناك أي رسالة خطأ ، فقم بتصحيح الخطأ وقم بتشغيل البرامج النصية shell مرة أخرى. إذا كانت هناك أي مشكلة في استخدام مسار تحليل Easy Shells CUTnRUN، فاطلب المساعدة في صفحة ويب مشكلات Easy Shells CUTnRUN github (https://github.com/JunwooLee89/Easy-Shells_CUTnRUN/issues).
ملاحظة: توفر نتائج تحليل مخطط Venn هذه نظرة ثاقبة لاختيار أنسب خيارات استدعاء الذروة والأساليب والتكرارات ذات قابلية التكرار العالية لتحليل المصب. قد يكون من المفضل اختيار خيارات وطرق استدعاء الذروة التي تظهر أعلى أرقام الذروة المسماة مع تداخل جيد مع طرق وخيارات استدعاء الذروة الأخرى.
16. تحليل خرائط الحرارة ومتوسط المؤامرات لتصور القمم المسماة.
- افتح الجهاز واكتب echo $SHELL للتحقق من الغلاف الافتراضي في الطرف النشط. إذا كان Bash shell هو الغلاف الافتراضي في المحطة الطرفية الحالية، فقد يكون هناك شيء مثل /path/to/bash (على سبيل المثال، /bin/bash) في المحطة الطرفية.
- إذا لم تكن الغلاف الافتراضي هي Bash، فقم بتعيين Bash shell كغلاف افتراضي عن طريق كتابة chsh -s $(which bash) في المحطة الطرفية. إذا كانت المحطة الطرفية تستخدم Bash shell كافتراضي ، ففكر في تخطي هذه الخطوة
- اكتب ~ / Desktop / Easy-Shells_CUTnRUN / scripts / Script_27_plotHeatmap_focused.sh في الجهاز الطرفي أو اسحب ملف البرنامج النصي shell إلى الجهاز وأدخله.
ملاحظة: تمت كتابة هذا البرنامج النصي إلى: (i) تشغيل وظيفة النقطة المرجعية computeMatrix باستخدام ملفات bigWig المعادية وملفات ذروة السرير المركزة لإنشاء مصفوفات قراءة عادية في وسط القمم المركزة في المجلد ~/Desktop/GSE126612/deeptools_computeMatrix . (ii) قم بتشغيل وظيفة plotHeatmap باستخدام مصفوفة عمليات إعادة القراءة الطبيعية لإنشاء خرائط حرارية ومخططات متوسطة تصور نمط توزيع عمليات إعادة القراءة الطبيعية في مواقع الذروة المركزة. (iii) قم بإنشاء مجلد واحد (~ / Desktop / GSE126612 / deeptools_plotHeatmap) واحفظ ملفات إخراج plotHeatmap داخل هذا المجلد. (iv) اكتب log_plotHeatmap_focused.txt ملف سجل واحد في مجلد ~ / Desktop / GSE126612 / log / plotHeatmap .
- اكتب ~ / Desktop / Easy-Shells_CUTnRUN / scripts / Script_27_plotHeatmap_whole.sh في الجهاز أو اسحب ملف البرنامج النصي shell إلى الجهاز وأدخله.
تمت كتابة هذا البرنامج النصي إلى: (i) تشغيل وظيفة النقطة المرجعية computeMatrix باستخدام ملفات bigWig المعادية وملفات ذروة السرير بالكامل لإنشاء مصفوفات قراءة طبيعية في وسط القمم بأكملها في المجلد ~ / Desktop / GSE126612 / deeptools_computeMatrix . (ii) قم بتشغيل وظيفة plotHeatmap باستخدام مصفوفة عمليات إعادة القراءة الطبيعية لإنشاء خرائط حرارية ومخططات متوسطة تصور نمط توزيع عمليات إعادة القراءة الطبيعية في مواقع الذروة بأكملها. (ثالثا) قم بإنشاء مجلد واحد (~ / Desktop / GSE126612 / deeptools_plotHeatmap) واحفظ ملفات إخراج plotHeatmap داخل هذا المجلد. (iv) اكتب log_plotHeatmap_whole.txt ملف سجل واحد في مجلد ~ / Desktop / GSE126612 / log / plotHeatmap .
- بعد الانتهاء من تشغيل البرامج النصية shell ، راجع ملفات السجل. إذا كانت هناك أي رسالة خطأ ، فقم بتصحيح الخطأ وقم بتشغيل البرامج النصية shell مرة أخرى. إذا كانت هناك أي مشكلة في استخدام مسار تحليل Easy Shells CUTnRUN، فاطلب المساعدة في صفحة ويب مشكلات Easy Shells CUTnRUN github (https://github.com/JunwooLee89/Easy-Shells_CUTnRUN/issues).
ملاحظة: من الناحية المثالية ، تظهر مواقع الذروة لقمم MACS2 / 3 ومواقع الذروة المركزة لقمم SEACR توزيعا حادا ومركزا للإشارة في وسط المؤامرات. ومع ذلك ، إذا لم تعمل خوارزمية استدعاء الذروة بشكل صحيح لبيانات CUT & RUN ، فقد يظهر توزيع إشارة "صاخبة" أقل تركيزا في المخططات. لذلك ، فإن استخدام عدد القمم المستدعى وأنماط توزيع إشارة الذروة لمخططات الإخراج سيوجه تحديد صلاحية الذروة لمزيد من تحليل CUT & RUN الذي يتضمن تعليق ذروة المصب.