JoVE Logo

Войдите в систему

Для просмотра этого контента требуется подписка на Jove Войдите в систему или начните бесплатную пробную версию.

В этой статье

  • Резюме
  • Аннотация
  • Введение
  • протокол
  • Результаты
  • Обсуждение
  • Раскрытие информации
  • Благодарности
  • Материалы
  • Ссылки
  • Перепечатки и разрешения

Резюме

Здесь мы представляем протокол, демонстрирующий установку и использование биоинформатического конвейера для анализа данных секвенирования химерной РНК, используемых при изучении взаимодействий РНК:РНК in vivo .

Аннотация

Понимание регуляторных взаимодействий генов in vivo малых некодирующих РНК (sncRNAs), таких как микроРНК (miRNAs), с их РНК-мишенями было продвинуто в последние годы благодаря биохимическим подходам, которые используют кросс-линкинг с последующим лигированием для захвата взаимодействий sncRNA:целевая РНК путем образования химерных РНК и последующих библиотек секвенирования. В то время как наборы данных, полученные при секвенировании химерной РНК, предоставляют полногеномные и значительно менее неоднозначные входные данные, чем программное обеспечение для прогнозирования микроРНК, преобразование этих данных в значимую и полезную информацию требует дополнительного анализа и может отпугнуть исследователей, не имеющих вычислительной подготовки. Этот отчет представляет собой учебное пособие для специалистов по вычислительной биологии начального уровня в установке и применении новейшего программного инструмента с открытым исходным кодом: Small Chimeric RNA Analysis Pipeline (SCRAP). Приведены требования к платформе, обновления, а также объяснение этапов конвейера и манипуляций с ключевыми переменными, вводимыми пользователем. Снижение барьера для биологов в получении информации от химерных подходов к секвенированию РНК может дать толчок к исследованиям регуляторных взаимодействий sncRNA:РНК-мишени в различных биологических контекстах, основанных на открытиях.

Введение

Малые некодирующие РНК хорошо изучены на предмет их посттранскрипционной роли в координации экспрессии наборов генов в различных процессах, таких как дифференцировка и развитие, обработка сигналов и заболевания 1,2,3. Способность точно определять целевые транскрипты геннорегуляторных малых некодирующих РНК (sncRNAs), включая микроРНК (miRNAs), имеет важное значение для изучения биологии РНК как на базовом, так и на трансляционном уровнях. Биоинформатические алгоритмы, использующие ожидаемую комплементарность между семенной последовательностью микроРНК и ее потенциальными мишенями, часто используются для прогнозирования взаимодействий микроРНК с целевой РНК. Несмотря на то, что эти биоинформатические алгоритмы оказались успешными, они также могут давать как ложноположительные, так и ложноотрицательные результаты, как было рассмотрено в других статьях 4,5,6. В последнее время было разработано и внедрено несколько биохимических подходов, которые позволяют однозначно и полуколичественно определять взаимодействия sncRNA:РНК-мишень in vivo путем сшивания in vivo и последующего включения этапа лигирования для физического присоединения sncRNA к мишени с образованием единой химерной РНК 4,5,7,8,9,10 . Последующая подготовка секвенирующих библиотек из химерных РНК позволяет оценить взаимодействия sncRNA:РНК-мишень путем компьютерной обработки данных секвенирования. В этом видео представлено учебное пособие по установке и использованию вычислительного конвейера, называемого малым конвейером анализа химерной РНК (SCRAP), который предназначен для обеспечения надежного и воспроизводимого анализа взаимодействий sncRNA:целевая РНК из библиотек секвенирования химерной РНК6.

Цель данного учебного пособия состоит в том, чтобы помочь исследователям избежать чрезмерной зависимости от чисто прогностических биоинформатических алгоритмов путем снижения барьеров для анализа данных, полученных с помощью биохимических подходов, обеспечивая химерные молекулярные считывания взаимодействий sncRNA:целевая РНК. В этом учебном пособии содержатся практические шаги и советы, которые помогут начинающим специалистам по вычислительной технике использовать конвейер SCRAP, разработанный для анализа данных секвенирования химерной РНК, которые могут быть получены с помощью нескольких существующих биохимических протоколов, включая сшивание, лигирование и секвенирование гибридов (CLASH) и ковалентное лигирование эндогенных аргонавт-связанных РНК - сшивание и иммунопреципитацию (CLEAR-CLIP)7,9.

Использование SCRAP дает ряд преимуществ для анализа данных секвенирования химерной РНК по сравнению с другими вычислительными конвейерами6. Одним из существенных преимуществ является обширное аннотирование и включение выносок в хорошо поддерживаемые и регулярно обновляемые биоинформатические сценарии в конвейере по сравнению с альтернативными конвейерами, которые часто полагаются на пользовательские и/или неподдерживаемые сценарии для этапов конвейера. Эта функция обеспечивает стабильность SCRAP, что делает более полезным для исследователей ознакомиться с конвейером и включить его использование в свой рабочий процесс. Также было продемонстрировано, что SCRAP превосходит альтернативные конвейеры в вызове пиков взаимодействий sncRNA:целевая РНК и обладает кроссплатформенной функциональностью, как подробно описано в предыдущей публикации6.

К концу этого учебного пособия пользователи смогут (i) узнать требования к платформе для SCRAP и установить конвейеры SCRAP, (ii) установить эталонные геномы и настроить параметры командной строки для SCRAP, и (iii) понять критерии пиковых вызовов и выполнять пиковые вызовы и пиковые аннотации.

В этом видео будет подробно описано, как исследователи, изучающие биологию РНК, могут установить и оптимально использовать вычислительный конвейер SCRAP для анализа взаимодействий sncRNA с целевыми РНК, такими как матричные РНК, в данных химерного секвенирования РНК, полученных с помощью одного из обсуждаемых биохимических подходов к подготовке библиотеки секвенирования.

SCRAP — это утилита командной строки. Как правило, следуя приведенному ниже руководству, пользователю необходимо (i) загрузить и установить SCRAP (https://github.com/Meffert-Lab/SCRAP), (ii) установить референсные геномы и запустить SCRAP, и (iii) выполнить пиковый вызов и аннотацию.

Более подробную информацию о шагах вычислений в этой процедуре можно найти на https://github.com/Meffert-Lab/SCRAP. В этой статье мы предоставим настройку и справочную информацию, которая позволит исследователям с вычислительными навыками начального уровня устанавливать, оптимизировать и использовать SCRAP в наборах данных библиотеки химерного секвенирования РНК.

Access restricted. Please log in or start a trial to view this content.

протокол

ПРИМЕЧАНИЕ: Протокол начнется с загрузки и установки программного обеспечения, необходимого для анализа библиотек секвенирования химерной РНК с помощью SCRAP.

1. Установка

  1. Перед установкой SCRAP установите зависимости Git и Miniconda на компьютере, который будет использоваться для анализа. Скорее всего, Git уже установлен. Например, на платформе Mac OSX проверьте это с помощью какой команды git, чтобы убедиться, что утилита " git " присутствует и установлена в этом каталоге. Проверьте, установлена ли Miniconda с помощью каких conda. Если ничего не возвращается, установите Miniconda. Для установки Miniconda требуется 400 МБ дискового пространства.
    1. Существует несколько способов установки Miniconda, и они различаются в зависимости от платформы. Обратитесь к файлу markdown PLATFORM-SETUP в репозитории Meffert Lab GitHub [https://github.com/Meffert-Lab/SCRAP/blob/main/PLATFORM-SETUP.md], где есть дальнейшие инструкции по установке на Windows, MacOS и Ubuntu. Для пользователей Linux есть свой собственный менеджер пакетов по умолчанию (apt). В случае, относящемся к данному исследованию, используйте команду brew install Miniconda, чтобы установить Miniconda с помощью существующего менеджера пакетов brew.
      ПРИМЕЧАНИЕ: «Homebrew», называемая «brew», — это система управления пакетами программного обеспечения с открытым исходным кодом, которая упрощает установку программного обеспечения в операционной системе Apple, macOS.
    2. Если conda устанавливается впервые, запустите conda init для конкретной используемой оболочки. В приведенном ниже примере используется оболочка zsh. Затем закройте и снова откройте оболочку. Если conda была успешно установлена, будет видна базовая среда, активированная во время сеанса терминала.
  2. Загрузите исходный код SCRAP и установите его зависимости.
    1. Предпочтительным методом получения исходного кода SCRAP является использование Git. Чтобы получить доступ к нему, выполните команду git clone https://github.com/Meffert-Lab/SCRAP, чтобы получить последнюю копию исходного кода.
    2. Установите mamba, улучшенный решатель пакетов для conda, и установите все зависимости для SCRAP из SCRAP_environment.yml в его собственную среду conda, используя следующие команды:
      conda install -n base conda-forge::mamba
      mamba env create -f SCRAP/SCRAP_environment.yml -n SCRAP
  3. Затем запустите эталонную установку для SCRAP. Аргументы, используемые в референсной установке, будут специфичны для организма, чьи взаимодействия sncRNA-мРНК анализируются.
    bash SCRAP/bin/Reference_Installation.sh -r full/path/to/SCRAP/ -m has -g hg38 -s human
    1. Укажите каталог исходной папки SCRAP для эталонной установки. Затем шаги по установке будут выполнены с использованием файлов в папках fasta и annotation . Перечислите полный путь без сокращений. Заканчивается косой чертой.
    2. Обратитесь к таблицам в README.md для получения правильных аббревиатур видов miRbase. Актуальные референсные геномы можно найти в https://genome.ucsc.edu/ или https://www.ncbi.nlm.nih.gov/data-hub/genome/. В этом примере hg38 будет использоваться для мышиного генома GRCm38.
    3. В настоящее время для аннотации включены следующие виды: человек, мышь и червь. Просмотрите соответствующие файлы species.annotation.bed в каталоге аннотаций в исходной папке SCRAP. Если для анализа требуется использовать другой вид, предоставьте файл annotation.bed, который соответствует той же схеме именования species.annotation.bed.

2. Запуск SCRAP

  1. Теперь, когда зависимости и SCRAP установлены, запустите скрипт SCRAP.sh
    bash SCRAP/bin/SCRAP.sh -d полный/путь/к/CLASH_Human/ -a полный/путь/к/CLASH_Human/CLASH_Human_Adapters.txt -p нет -f да -r полный/путь/к/SCRAP/ -m has -g hg38
    1. Перечислите весь путь к примерам каталогов без каких-либо сокращений. Отформатируйте каталоги образцов так, чтобы имя папки точно совпадало с именем образца, как показано на рисунке 1.
    2. Обратите внимание, что указанный путь — это путь к каталогу, содержащему все образцы папок, а не путь к какой-либо отдельной папке или файлу образца (см. командную строку на шаге 2.1).
    3. Далее перечислите весь путь к файлу адаптера. Убедитесь, что имена примеров в файле адаптера совпадают с ранее упомянутыми именами папок и именами файлов (см. командную строку на шаге 2.1).
    4. Укажите, являются ли образцы парными и будет ли проводиться фильтрация по пре-микроРНК и/или тРНК. При необходимости добавьте фильтр для очистки рРНК (см. командную строку в шаге 2.1).
      ПРИМЕЧАНИЕ: Пользователи могут принять или не решить использовать эти фильтры в зависимости от типов выборки и целей эксперимента. В зависимости от дизайна эксперимента, пре-микроРНК, тРНК и рРНК могут использовать доступную глубину секвенирования для реальных хиер sncRNA:целевая РНК, и пользователи могут использовать фильтры для их исключения. Тем не менее, пользователи могут захотеть избежать такой фильтрации при определенных обстоятельствах (например, сопоставление мишеней sncRNA с митохондриальным геномом, который содержит митохондриальные рРНК).
    5. Затем перечислите весь путь к ссылочному каталогу, аббревиатуру miRbase и референсную аббревиатуру генома (см. командную строку на шаге 2.1).
      ПРИМЕЧАНИЕ: Выполнение сценария может занять несколько часов, в зависимости от размера набора данных и используемого ЦП.

3. Пиковый вызов и аннотация

  1. После завершения работы SCRAP убедитесь, что выходные данные включают, помимо других файлов, файл SAMPLE.aligned.unique.bam. Это бинарный файл, содержащий выравнивание целевых РНК по предоставленному пользователем референсному геному.
  2. Теперь выполните пиковые вызовы , выполнив Peak_Calling.sh.
    bash SCRAP/bin/Peak_Calling.sh -d CLASH_Human/ -a CLASH_Human/CLASH_Human_Adapters.txt -c 3 -l 2 -f no -r SCRAP/ -m has -g hg38
    ПРИМЕЧАНИЕ: Пиковый вызов — это функция SCRAP, которая предназначена для того, чтобы позволить исследователям легко оценивать наиболее надежные и воспроизводимые небольшие некодирующие взаимодействия РНК:целевая РНК в своих химерных библиотеках РНК. Эта функция, например, может помочь исследователям в выявлении взаимодействий, которые они, возможно, захотят выбрать для дальнейшего изучения. На шаге 3.2.2 ниже описывается, как пользователь устанавливает критерии, которые он хочет использовать для определения строгости, с которой вызывается пик - это включает в себя количество уникальных взаимодействий или последовательных чтений, которые должны произойти для вызова пика, а также количество библиотек, в которых должно произойти это конкретное взаимодействие.
    1. Опять же, перечислите полные пути к каталогу, содержащему примеры папок, и файлу адаптера (см. командную строку в шаге 3.2).
    2. Затем установите минимальное количество операций чтения последовательности, необходимое для вызова пика (см. командную строку в шаге 3.2).
    3. Установите минимальное количество различных библиотек секвенирования, которые должны содержать пик для его вызова (см. командную строку в шаге 3.2).
      ПРИМЕЧАНИЕ: Выбор значений как для 3.2.2, так и для 3.2.3 будет зависеть от характера секвенированных образцов и количества образцов или типов образцов. В этом случае для вызова пика требуется не менее 3 считываний химерного секвенирования в выборке, и пик должен поддерживаться не менее чем 2 выборками. Например, исследователь, оценивающий набор данных, в котором имеется много репликаций библиотек секвенирования для данного условия, может принять решение о том, что чтение должно присутствовать в большем количестве библиотек секвенирования выборки.
    4. Укажите, должны ли sncRNA одного семейства вносить свой вклад в один и тот же пик. Например, поскольку микроРНК одного и того же семейства имеют общие семенные последовательности, эти микроРНК могут связывать общие и перекрывающиеся наборы генов-мишеней; Пользователь может захотеть определить полное влияние семейства на эти цели, оценив их коллективные пики (см. командную строку на шаге 3.2).
    5. Затем укажите полный путь к референсному каталогу, аббревиатуру miRBase и референсную аббревиатуру генома (см. командную строку на шаге 3.2).
  3. После завершения пикового вызова запустите аннотацию пика.
    bash SCRAP/bin/Peak_Annotation.sh -p CLASH_Human/peaks.bed -r SCRAP/ -s human
    1. Укажите полный путь к результирующему файлу peaks.bed (или peaks.family.bed) из пикового вызова, полный путь к ссылочному каталогу и желаемый вид для аннотации.

4. Визуализация данных

ПРИМЕЧАНИЕ: Все шаги по анализу с использованием SCRAP завершены. Для визуализации данных рекомендуется несколько подходов:

  1. Объедините все файлы .bam (бинарный файл SAM), которые необходимо визуализировать вместе (samtools merge).
  2. Отсортируйте получившийся объединенный файл .bam (samtools sort). Содержимое файла сортируется построчно, чтобы samtools мог индексироваться.
  3. Проиндексируйте отсортированный файл .bam (индекс samtools). Файл BAI (binary samtools format index) генерируется для визуализации в средстве просмотра интегративной геномики (IGV).
  4. Наконец, откройте получившийся отсортированный файл .bam и индексированный .bai в IGV.
    ПРИМЕЧАНИЕ: Взаимодействие SncRNA:Целевая РНК, представляющее интерес, может быть приоритетным для последующего наблюдения несколькими способами, специфичными для исследования. Один из общих первоначальных подходов состоит в том, чтобы оценить взаимодействия, для которых пики поддерживаются наиболее химерными чтениями секвенирования. Интересующие взаимодействия также могут быть визуализированы с помощью веб-сервера DuplexFold из пакета RNAstructure путем ввода последовательности как для sncRNA, так и для целевой РНК из обнаруженного взаимодействия11. Для каждого пика хромосома (первый столбец) и геномные координаты (начало: 1-й столбец, конец: 2-й столбец) можно найти в файле peaks.bed.species.annotation.txt, созданном в аннотации пика. В частности, для микроРНК, в то время как воспроизводимые и функциональные взаимодействия могут отсутствовать обширное связывание с семенами (например, взаимодействия могут использовать 3'-компенсаторное связывание), наличие сайтов, совпадающих с семенами, в родственном связывающем мотиве РНК-мишени, тем не менее, может быть оценено как валидационный признак функционально важных обнаруженных взаимодействий 4,12. Обработка вспомогательных данных может включать в себя сравнение дифференциального покрытия считывания между пиками в различных биологических условиях и, возможно, оценку кластеризации регулируемых генов в пути с помощью инструмента анализа путей.

Access restricted. Please log in or start a trial to view this content.

Результаты

Результаты для sncRNA:target RNA, обнаруженной модифицированной версией SCRAP (SCRAP release 2.0, в которой реализованы модификации для фильтрации рРНК) на ранее опубликованных наборах данных секвенирования, подготовленных с использованием CLEAR-CLIP9 , показаны на рисунке 2 и

Access restricted. Please log in or start a trial to view this content.

Обсуждение

Этот протокол по использованию конвейера SCRAP для анализа взаимодействий sncRNA:РНК-мишени предназначен для помощи исследователям, которые приступают к вычислительному анализу. Ожидается, что по завершении учебного пособия исследователи с опытом вычислений начального уровня или выше пр?...

Access restricted. Please log in or start a trial to view this content.

Раскрытие информации

Авторам нечего раскрывать.

Благодарности

Мы благодарим сотрудников лаборатории Мефферта за полезные обсуждения, в том числе Б.Х. Пауэлла и У.Т. Миллса IV, за критические отзывы об описании установки и реализации трубопровода. Эта работа была поддержана премией Фонда Брауде, программой запуска Фонда исследований стволовых клеток штата Мэриленд, премией Фонда Блаустейна за исследования и образование в области боли, а также RO1MH129292 NINDS RO1NS103974 и NIMH для M.K.M.

Access restricted. Please log in or start a trial to view this content.

Материалы

NameCompanyCatalog NumberComments
GenomesUCSC Genome browserN/Ahttps://genome.ucsc.edu/ or https://www.ncbi.nlm.nih.gov/data-hub/genome/
LinuxLinuxUbuntu 20.04 or 22.04 LTS recommended
MacAppleMac OSX (>11)
Platform setupGitHubN/Ahttps://github.com/Meffert-Lab/SCRAP/blob/main/PLATFORM-SETUP.md]
SCRAP pipelineGitHubN/Ahttps://github.com/Meffert-Lab/SCRAP
Unix shellUnix operating systembash >=5.0
Unix shellUnix operating systemzsh (5.9 recommended)
WindowsWindowsWSL Ubuntu 20.04 or 22.04 LTS

Ссылки

  1. Morris, K. V., Mattick, J. S. The rise of regulatory RNA. Nature Reviews Genetics. 15 (6), 423-437 (2014).
  2. Li, X., Jin, D. S., Eadara, S., Caterina, M. J., Meffert, M. K. Regulation by noncoding RNAs of local translation, injury responses, and pain in the peripheral nervous system. Neurobiology of Pain (Cambridge, Mass.). 13, 100119(2023).
  3. Shi, J., Zhou, T., Chen, Q. Exploring the expanding universe of small RNAs. Nature Cell Biology. 24 (4), 415-423 (2022).
  4. Broughton, J. P., Lovci, M. T., Huang, J. L., Yeo, G. W., Pasquinelli, A. E. Pairing beyond the seed supports microRNA targeting specificity. Molecular Cell. 64 (2), 320-333 (2016).
  5. Grosswendt, S., et al. Unambiguous identification of miRNA:target site interactions by different types of ligation reactions. Molecular Cell. 54 (6), 1042-1054 (2014).
  6. Mills, W. T., Eadara, S., Jaffe, A. E., Meffert, M. K. SCRAP: a bioinformatic pipeline for the analysis of small chimeric RNA-seq data. RNA. 29 (1), 1-17 (2023).
  7. Helwak, A., Kudla, G., Dudnakova, T., Tollervey, D. Mapping the human miRNA interactome by CLASH reveals frequent noncanonical binding. Cell. 153 (3), 654-665 (2013).
  8. Hoefert, J. E., Bjerke, G. A., Wang, D., Yi, R. The microRNA-200 family coordinately regulates cell adhesion and proliferation in hair morphogenesis. Journal of Cell Biology. 217 (6), 2185-2204 (2018).
  9. Moore, M. J., Zhang, C., Gantman, E. C., Mele, A., Darnell, J. C., Darnell, R. B. Mapping Argonaute and conventional RNA-binding protein interactions with RNA at single-nucleotide resolution using HITS-CLIP and CIMS analysis. Nature Protocols. 9 (2), 263-293 (2014).
  10. Bjerke, G. A., Yi, R. Integrated analysis of directly captured microRNA targets reveals the impact of microRNAs on mammalian transcriptome. RNA. 26 (3), 306-323 (2020).
  11. Reuter, J. S., Mathews, D. H. RNAstructure: software for RNA secondary structure prediction and analysis. BMC Bioinformatics. 11 (1), 129(2010).
  12. Moore, M. J., et al. miRNA-target chimeras reveal miRNA 3′-end pairing as a major determinant of Argonaute target specificity. Nature Communications. 6 (1), 8864(2015).
  13. Travis, A. J., Moody, J., Helwak, A., Tollervey, D., Kudla, G. Hyb: a bioinformatics pipeline for the analysis of CLASH (crosslinking, ligation and sequencing of hybrids) data. Methods (San Diego, Calif.). 65 (3), 263-273 (2014).

Access restricted. Please log in or start a trial to view this content.

Перепечатки и разрешения

Запросить разрешение на использование текста или рисунков этого JoVE статьи

Запросить разрешение

Смотреть дополнительные статьи

JoVE202

This article has been published

Video Coming Soon

JoVE Logo

Исследования

Образование

О JoVE

Авторские права © 2025 MyJoVE Corporation. Все права защищены