Для просмотра этого контента требуется подписка на Jove Войдите в систему или начните бесплатную пробную версию.
Этот протокол помогает новичкам в биоинформатике пройти через вводный конвейер анализа CUT&RUN, который позволяет пользователям завершить первоначальный анализ и проверку данных секвенирования CUT&RUN. Выполнение описанных здесь этапов анализа в сочетании с аннотацией нисходящих пиков позволит пользователям получить механистическое представление о регуляции хроматина.
Метод CUT&RUN облегчает обнаружение белок-ДНК-взаимодействий по всему геному. Типичные области применения CUT&RUN включают профилирование изменений в модификациях хвоста гистонов или картирование занятости хроматина транскрипционного фактора. Широкое распространение CUT&RUN обусловлено, в частности, техническими преимуществами по сравнению с обычным ChIP-seq, которые включают в себя более низкие требования к входу клеток, более низкие требования к глубине секвенирования и повышенную чувствительность при снижении фонового сигнала из-за отсутствия сшивающих агентов, которые в противном случае маскируют эпитопы антител. Широкое внедрение CUT&RUN также было достигнуто благодаря щедрому обмену реагентами лабораторией Henikoff и разработке коммерческих наборов для ускорения освоения для начинающих. По мере расширения технического внедрения CUT&RUN анализ и валидация секвенирования CUT&RUN становятся критически важными узкими местами, которые необходимо преодолеть, чтобы обеспечить полное внедрение преимущественно мокрыми лабораторными командами. Анализ CUT&RUN обычно начинается с проверки качества необработанных прочтений секвенирования для оценки глубины секвенирования, качества чтения и потенциальных смещений. Затем прочтения выравниваются с эталонной сборкой последовательности генома, а затем используются несколько биоинформационных инструментов для аннотирования областей обогащения генома белками, подтверждения интерпретируемости данных и получения биологических выводов. Несмотря на то, что для поддержки анализа данных CUT&RUN было разработано множество конвейеров анализа in silico , их сложная многомодульная структура и использование нескольких языков программирования делают платформы сложными для новичков в биоинформатике, которые могут не быть знакомы с несколькими языками программирования, но хотят понять процедуру анализа CUT&RUN и настроить свои конвейеры анализа. Здесь мы предоставляем одноязычный протокол пошагового анализа CUT&RUN, предназначенный для пользователей с любым уровнем опыта в области биоинформатики. Этот протокол включает в себя выполнение критических проверок качества для подтверждения того, что данные секвенирования пригодны для биологической интерпретации. Мы ожидаем, что следование вводному протоколу, представленному в этой статье, в сочетании с аннотацией нисходящих пиков позволит пользователям извлекать биологические выводы из своих собственных наборов данных CUT&RUN.
Возможность измерения взаимодействий между белками и геномной ДНК имеет фундаментальное значение для понимания биологии регуляции хроматина. Эффективные анализы, которые измеряют занятость хроматина для данного белка, дают по крайней мере две ключевые части информации: 1) геномную локализацию и 2) распространенность белка в данной области генома. Отслеживание изменений рекрутмента и локализации белка, представляющего интерес в хроматине, может выявить локусы-мишени белка и выявить механистическую роль этого белка в биологических процессах на основе хроматина, таких как регуляция транскрипции, репарация ДНК или репликация ДНК. Доступные сегодня методы профилирования белково-ДНК-взаимодействий позволяют исследователям изучать регуляцию с беспрецедентным разрешением. Такие технические достижения стали возможными благодаря внедрению новых методов профилирования хроматина, которые включают в себя разработку методов расщепления под мишенями и высвобождения с использованием нуклеазы (CUT&RUN) лабораторией Henikoff. CUT&RUN имеет ряд технических преимуществ по сравнению с обычной иммунопреципитацией хроматина (ChIP), которые включают в себя более низкие требования к входу клеток, более низкие требования к глубине секвенирования и повышенную чувствительность при сниженном фоновом сигнале из-за отсутствия сшивающих агентов, которые в противном случае маскируют эпитопы антител. Использование этого метода для изучения регуляции хроматина требует глубокого понимания принципа, лежащего в основе этого метода, а также понимания того, как анализировать, проверять и интерпретировать данные CUT&RUN.
Процедура CUT&RUN начинается со связывания клеток с конканавалином А, конъюгированным с магнитными шариками, чтобы обеспечить манипуляции с низким количеством клеток на протяжении всей процедуры. Изолированные клетки проникают с помощью мягкого детергента, чтобы облегчить введение антитела, нацеленного на интересующий белок. Затем микрококковая нуклеаза (MNase) рекрутируется в связанное антитело с помощью метки Protein A или Protein A/G, привязанной к ферменту. Кальций вводится для инициирования ферментативной активности. В результате расщепления МНазы образуются мононуклеосомные ДНК-белковые комплексы. Кальций впоследствии хелатируют, чтобы завершить реакцию расщепления, и короткие фрагменты ДНК в результате расщепления MNазы высвобождают из ядер, затем подвергают очистке ДНК, подготовке библиотеки и высокопроизводительному секвенированию1 (рис. 1).
Подходы in silico к картированию и количественной оценке занятости белка в геноме развивались параллельно с лабораторными подходами, используемыми для обогащения этих ДНК-белковых взаимодействий. Идентификация областей обогащенных сигналов (пиков) является одним из наиболее важных этапов биоинформатического анализа. Первоначальные методы анализа ChIP-seq использовали такие алгоритмы, как MACS2 и SICER3, в которых использовались статистические модели для различения истинных сайтов связывания белка и ДНК от фонового шума. Тем не менее, более низкий фоновый шум и более высокое разрешение данных CUT&RUN делают некоторые программы пиковых вызовов, используемые в анализе ChIP-seq, непригодными для анализа CUT&RUN4. Эта проблема подчеркивает потребность в новых инструментах, лучше подходящих для анализа данных CUT&RUN. SEACR4 представляет собой один из таких инструментов, недавно разработанных для обеспечения пиковых вызовов из данных CUT&RUN при одновременном преодолении ограничений, связанных с инструментами, обычно используемыми для анализа ChIP-seq.
Биологические интерпретации данных секвенирования CUT&RUN извлекаются из выходных данных после пикового вызова в конвейере анализа. Для прогнозирования потенциальной биологической значимости вызываемых пиков по данным CUT&RUN может быть реализовано несколько функциональных программ аннотации. Например, проект Gene Ontology (GO) обеспечивает хорошо зарекомендовавшую себя функциональную идентификацию генов, представляющих интерес 5,6,7. Различные программные инструменты и ресурсы облегчают анализ GO для выявления генов и наборов генов, обогащенныхпиками CUT&RUN 8,9,10,11,12,13,14. Кроме того, программное обеспечение для визуализации, такое как Deeptools15, Integrative genomics viewer (IGV)16 и UCSC Genome Browser17, позволяет визуализировать распределение сигналов и закономерности в интересующих областях генома.
Способность извлекать биологические интерпретации из данных CUT&RUN в решающей степени зависит от валидации качества данных. К критически важным компонентам для валидации относятся оценка: i) качества секвенирования библиотеки CUT&RUN, ii) сходства реплик и iii) распределения сигнала в пиковых центрах. Завершение валидации всех трех компонентов имеет решающее значение для обеспечения надежности образцов библиотеки CUT&RUN и результатов последующего анализа. Поэтому важно создать вводные руководства по анализу CUT&RUN, чтобы позволить начинающим биоинформатикам и исследователям мокрых лабораторий проводить такие этапы проверки в рамках своих стандартных аналитических конвейеров CUT&RUN.
Наряду с разработкой эксперимента CUT&RUN в мокрой лаборатории, для поддержки анализа данных CUT&RUN были разработаны различные конвейеры анализа in silico CUT&RUN, такие как CUT&RUNTools2.0 18,19, nf-core/cutandrun20 и CnRAP21. Эти инструменты обеспечивают эффективные подходы к анализу одноклеточных и массовых наборов данных CUT&RUN и CUT&Tag. Тем не менее, относительно сложная модульная структура программы и необходимое знакомство с несколькими языками программирования для проведения этих конвейеров анализа могут препятствовать внедрению биоинформатики новичками, которые стремятся досконально понять этапы анализа CUT&RUN и настроить свои собственные конвейеры. Чтобы обойти этот барьер, требуется новый вводный конвейер анализа CUT&RUN, который предоставляется в виде простых пошаговых скриптов, закодированных с использованием простого единого языка программирования.
В этой статье мы опишем простой одноязычный протокол конвейера анализа CUT&RUN, который предоставляет пошаговые скрипты с подробными описаниями, позволяющими новым и начинающим пользователям проводить анализ секвенирования CUT&RUN. Программы, используемые в этом конвейере, являются общедоступными для исходных групп разработчиков. Основные этапы, описанные в этом протоколе, включают выравнивание чтения, вызов пиков, функциональный анализ и, что наиболее важно, этапы валидации для оценки качества образца для определения пригодности и надежности данных для биологической интерпретации (рис. 2). Кроме того, этот конвейер предоставляет пользователям возможность сопоставлять результаты анализа с общедоступными наборами данных CUT&RUN. В конечном счете, этот протокол конвейера анализа CUT&RUN служит вводным руководством и справочником для начинающих специалистов в области биоинформатического анализа и исследователей в мокрых лабораториях.
ПРИМЕЧАНИЕ: Информация о файлах CUT&RUN fastq в GSE126612 доступна в Таблице 1. Информация, относящаяся к программным приложениям, использованным в данном исследовании, приведена в Таблице материалов.
1. Загрузка конвейера Easy-Shells_CUTnRUN со страницы на Github
2. Установка программ, необходимых для Easy Shells CUTnRUN
3. Загрузка общедоступного набора данных CUT&RUN из архива чтения последовательностей (SRA)
4. Первичная проверка качества исходных файлов секвенирования
5. Обрезка качества и адаптера для файлов необработанной секвенирования
6. Загрузка индекса bowtie2 для референсных геномов для фактических и контрольных образцов
7. Картирование обрезанных считываний секвенирования CUT&RUN с референсными геномами
8. Сортировка и фильтрация сопоставленных файлов прочитанных пар
9. Конвертация сопоставленных пар чтения во фрагменты файлов BEDPE, BED и необработанных счетчиков прочтений bedGraph
10. Конвертация необработанных файлов bedGraph с подсчетом прочтений в нормализованные файлы bedGraph и bigWig
11. Валидация распределения фрагментов по размерам
12. Вызов пиковых значений с использованием MACS2, MACS3 и SEACR
13. Создание файлов с вызовом пикового ложа
14. Проверка сходства между репликациями с помощью корреляции Пирсона и анализа главных компонент (ПК).
15. Проверка сходства между репликациями, методами вызова пиков и опциями с помощью диаграммы Венна
16. Анализ тепловых карт и усредненных графиков для визуализации называемых пиков.
Качество и обрезка адаптера сохраняют прочтения с высоким качеством секвенирования
Методы секвенирования с высокой пропускной способностью склонны к возникновению ошибок секвенирования, таких как «мутации» последовательностей при чтении. Кроме того, ди...
Возможность картирования занятости белка на хроматине имеет основополагающее значение для проведения механистических исследований в области биологии хроматина. По мере того, как лаборатории внедряют новые методы профилирования хроматина, возможность анализирова?...
Авторы заявляют о неразглашении информации.
Все иллюстрированные рисунки были созданы с использованием BioRender.com. CAI выражает признательность за поддержку, предоставленную в виде премии Альянса по исследованию рака яичников для исследователей в начале карьеры, гранта Фонда Форбека и Национальной премии за исследования в области раннего выявления рака яичников Миннесотского альянса по раку яичников.
Name | Company | Catalog Number | Comments |
bedGraphToBigWig | ENCODE | https://hgdownload.soe.ucsc.edu/admin/exe/ | Software to compress and convert readcounts bedGraph to bigWig |
bedtools-2.31.1 | The Quinlan Lab @ the U. of Utah | https://bedtools.readthedocs.io/en/latest/index.html | Software to process bam/bed/bedGraph files |
bowtie2 2.5.4 | Johns Hopkins University | https://bowtie-bio.sourceforge.net/bowtie2/index.shtml | Software to build bowtie index and perform alignment |
CollectInsertSizeMetrics (Picard) | Broad institute | https://github.com/broadinstitute/picard | Software to perform insert size distribution analysis |
Cutadapt | NBIS | https://cutadapt.readthedocs.io/en/stable/index.html | Software to perform adapter trimming |
Deeptoolsv3.5.1 | Max Planck Institute | https://deeptools.readthedocs.io/en/develop/index.html | Software to perform Pearson coefficient correlation analysis, Principal component analysis, and Heatmap/average plot analysis |
FastQC Version 0.12.0 | Babraham Bioinformatics | https://github.com/s-andrews/FastQC | Software to check quality of fastq file |
Intervenev0.6.1 | Computational Biology & Gene regulation - Mathelier group | https://intervene.readthedocs.io/en/latest/index.html | Software to perform venn diagram analysis using peak files |
MACSv2.2.9.1 | Chan Zuckerberg initiative | https://github.com/macs3-project/MACS/tree/macs_v2 | Software to call peaks |
MACSv3.0.2 | Chan Zuckerberg initiative | https://github.com/macs3-project/MACS/tree/master | Software to call peaks |
Samtools-1.21 | Wellcome Sanger Institute | https://github.com/samtools/samtools | Software to process sam/bam files |
SEACRv1.3 | Howard Hughes Medial institute | https://github.com/FredHutch/SEACR | Software to call peaks |
SRA Toolkit Release 3.1.1 | NCBI | https://github.com/ncbi/sra-tools | Software to download SRR from GEO |
Trim_Galore v0.6.10 | Babraham Bioinformatics | https://github.com/FelixKrueger/TrimGalore | Software to perform quality and atapter trimming |
Запросить разрешение на использование текста или рисунков этого JoVE статьи
Запросить разрешениеThis article has been published
Video Coming Soon
Авторские права © 2025 MyJoVE Corporation. Все права защищены