Войдите в систему

Для просмотра этого контента требуется подписка на Jove Войдите в систему или начните бесплатную пробную версию.

В этой статье

  • Резюме
  • Аннотация
  • Введение
  • протокол
  • Результаты
  • Обсуждение
  • Раскрытие информации
  • Благодарности
  • Материалы
  • Ссылки
  • Перепечатки и разрешения

Резюме

Представленный здесь протокол объясняет полный конвейер in silico , необходимый для прогнозирования и функциональной характеристики цирковых РНК на основе данных транскриптома секвенирования РНК, изучающих взаимодействия хозяина и патогена.

Аннотация

Кольцевые РНК (цирковые РНК) представляют собой класс некодирующих РНК, которые образуются путем обратного сплайсинга. Эти циркулярные РНК преимущественно изучаются на предмет их роли в качестве регуляторов различных биологических процессов. Примечательно, что новые данные демонстрируют, что цирковые РНК хозяина могут дифференциально экспрессироваться (ДЭ) при инфицировании патогенами (например, гриппом и коронавирусами), что свидетельствует о роли циркРНК в регуляции врожденных иммунных реакций хозяина. Однако исследования роли цирковых РНК во время патогенных инфекций ограничены знаниями и навыками, необходимыми для проведения необходимого биоинформатического анализа для идентификации цирковых РНК DE по данным секвенирования РНК (RNA-seq). Биоинформационное прогнозирование и идентификация циркулярных РНК имеет решающее значение перед любой проверкой и функциональными исследованиями с использованием дорогостоящих и трудоемких методов мокрой лаборатории. Для решения этой проблемы в данной рукописи приведен пошаговый протокол in silico предсказания и характеристики цирковых РНК с использованием данных RNA-seq. Протокол можно разделить на четыре этапа: 1) Прогнозирование и количественное определение циркулярных РНК DE с помощью конвейера CIRIquant; 2) Аннотация через circBase и характеристика цирковых РНК DE; 3) Прогнозирование взаимодействия CircRNA-miRNA через конвейер Circr; 4) анализ функционального обогащения родительских генов циркРНК с использованием Gene Ontology (GO) и Kyoto Encyclopedia of Genes and Genomes (KEGG). Этот конвейер будет полезен для проведения будущих исследований in vitro и in vivo для дальнейшего раскрытия роли цирковых РНК во взаимодействиях хозяина и патогена.

Введение

Взаимодействия хозяина и патогена представляют собой сложное взаимодействие между патогенами и организмами-хозяевами, которое запускает врожденные иммунные реакции хозяев, которые в конечном итоге приводят к удалению вторгшихся патогенов 1,2. Во время патогенных инфекций регулируется множество иммунных генов хозяина, чтобы ингибировать репликацию и высвобождение патогенов. Например, общие интерферон-стимулированные гены (ISG), регулируемые патогенными инфекциями, включают ADAR1, IFIT1, IFIT2, IFIT3, ISG20, RIG-I и OASL 3,4. Помимо генов, кодирующих белок, исследования также показали, что некодирующие РНК, такие как длинные некодирующие РНК (днРНК), микроРНК (миРНК) и кольцевые РНК (циркРНК), также играют роль и регулируются одновременно во время патогенных инфекций 5,6,7. В отличие от генов, кодирующих белки, которые в основном кодируют белки как функциональные молекулы, известно, что некодирующие РНК (нРНК) функционируют как регуляторы генов на транскрипционном и посттранскрипционном уровнях. Однако исследования, включающие участие некодирующих РНК, особенно цирковых РНК, в регуляции иммунных генов хозяев, не очень хорошо представлены по сравнению с генами, кодирующими белок.

Цирковые РНК широко характеризуются своей ковалентно замкнутой непрерывной петлевой структурой, которая генерируется с помощью неканонического процесса сплайсинга, называемого обратным сплайсингом8. Процесс обратного сплайсинга, в отличие от процесса сплайсинга родственных линейных РНК, включает лигирование нижестоящего донорного сайта с вышестоящим акцепторным сайтом, образуя структуру круглой формы. В настоящее время предложены три различных механизма обратного сплайсинга для биогенеза циркРНК. Это опосредованная РНК связывающим белком (RBP)циркуляция 9,10, циркуляция, управляемая спариванием интронов, 11 и циркуляция, управляемая лариатом12,13,14. Учитывая, что цирковые РНК соединены встык в кольцевую структуру, они, как правило, естественным образом устойчивы к нормальному расщеплению экзонуклеазы и, таким образом, считаются более стабильными, чем их линейные аналоги15. Другая общая характеристика, проявляемая циркРНК, включает специфическую для клеток или тканей экспрессию у хозяев16.

Как следует из их уникальной структуры и клеточной или тканеспецифической экспрессии, было обнаружено, что циркРНК играют важные биологические функции в клетках. На сегодняшний день одной из основных функций цирковых РНК является их роль в качестве губок микроРНК (миРНК)17,18. Эта регуляторная роль цирковых РНК происходит за счет комплементарного связывания нуклеотидов циркРНК с затравочной областью микроРНК. Такое взаимодействие circRNA-miRNA ингибирует нормальные регуляторные функции микроРНК на мРНК-мишенях, тем самым регулируя экспрессию генов 19,20. Кроме того, известно также, что цирковые РНК регулируют экспрессию генов, взаимодействуя с РНК-связывающими белками (RBP) и образуя РНК-белковые комплексы21. Хотя цирковые РНК классифицируются как некодирующие РНК, есть также доказательства того, что цирковые РНК могут выступать в качестве шаблонов для трансляции белка22,23,24.

Недавно было продемонстрировано, что цирковые РНК играют ключевую роль в регулировании взаимодействий хозяина и патогена, особенно между хозяевами и вирусами. Как правило, предполагается, что циркРНК хозяина помогают регулировать иммунные реакции хозяина для устранения вторгшихся патогенов. Примером циркулярной РНК, способствующей иммунному ответу хозяина, является circRNA_0082633, о чем сообщают Guo et al.25. Эта циркулярная РНК усиливает передачу сигналов интерферона I типа (ИФН) в клетках A549, что помогает подавить репликацию вируса гриппа25. Кроме того, Qu et al. также сообщили об интронной циркулярной РНК человека, называемой циркулярной РНК AIVR, которая способствует иммунитету, регулируя экспрессию CREB-связывающего белка (CREBBP), сигнального преобразователя ИФН-β26,27. Тем не менее, циркулярные РНК, которые, как известно, способствуют патогенезу заболевания при заражении, также существуют. Например, Yu et al. недавно сообщили о роли, которую играет циркулярная РНК, сплайсированная из домена цинкового пальца GATA, содержащего ген 2A (circGATAD2A), в стимулировании репликации вируса H1N1 посредством ингибирования аутофагии клетки-хозяина28.

Для эффективного изучения цирковых РНК обычно реализуется полногеномный алгоритм прогнозирования циркулярных РНК с последующей характеристикой in silico предсказанных кандидатов на циркРНК до того, как можно будет провести какие-либо функциональные исследования. Такой биоинформатический подход к прогнозированию и характеристике цирковых РНК является менее дорогостоящим и более эффективным по времени. Это помогает уточнить количество кандидатов, подлежащих функциональному изучению, и потенциально может привести к новым выводам. Здесь мы предоставляем подробный биоинформатический протокол для идентификации, характеристики и функциональной аннотации circRNA in silico во время взаимодействия хозяина и патогена. Протокол включает идентификацию и количественное определение цирковых РНК из наборов данных секвенирования РНК, аннотацию через circBase и характеристику кандидатов на цирковые РНК с точки зрения типов цирковых РНК, количества перекрывающихся генов и прогнозируемых взаимодействий циркРНК-миРНК. Это исследование также обеспечивает функциональную аннотацию родительских генов циркРНК с помощью онтологии генов (GO) и анализа обогащения Киотской энциклопедии генов и геномов (KEGG).

протокол

В этом протоколе из базы данных Gene Expression Omnibus (GEO) были загружены и использованы деидентифицированные наборы данных библиотеки РНК-секвенирования РНК (рРНК), подготовленные из инфицированных вирусом гриппа А клеток макрофагов человека. Весь конвейер биоинформатики от прогнозирования до функциональной характеристики циркулярных РНК кратко представлен на рисунке 1. Каждая часть конвейера более подробно описана в разделах ниже.

1. Подготовка, загрузка и настройка перед анализом данных

ПРИМЕЧАНИЕ: Все программные пакеты, используемые в этом исследовании, являются бесплатными и с открытым исходным кодом.

  1. Загрузка необходимых инструментов на платформе Linux
    1. Загрузите и установите необходимое программное обеспечение и инструменты, перечисленные в таблице материалов , на высокопроизводительный компьютер Linux, следуя инструкциям, предоставленным разработчиком.
      ПРИМЕЧАНИЕ: Большинство инструментов и программного обеспечения имеют свои собственные онлайн-страницы GitHub или документацию, содержащую инструкции по установке и использованию их инструментов (см. Таблицу материалов).
    2. Загрузите нужные наборы данных RNA-seq для обнаружения и анализа circRNA с веб-сайтов архива последовательностей (например, European Nucleotides Archive и Gene Expression Omnibus).
    3. Загрузите эталонный геном (геномы) (формат FASTA) и файлы аннотаций (формат GTF/GFF3), совместимые с хостом, из которого был подготовлен набор данных RNA-seq. Файлы эталонных геномов и аннотаций хостов обычно можно найти в онлайн-браузерах генома, таких как Национальный центр биотехнологической информации (NCBI), Калифорнийский университет в Санта-Крус (UCSC) и веб-сайты Ensembl.
  2. Проверка качества РНК-секвенирования
    1. Введите файлы FASTQ в программу FASTQC, чтобы определить качество последовательностей РНК. Если качество файлов FASTQ низкое (например, 29,30.

2. Прогнозирование и анализ дифференциальной экспрессии цирковых РНК с использованием CIRIquant

ПРИМЕЧАНИЕ: Более подробное руководство по установке и выполнению анализа дифференциальных выражений можно найти в разделе о доступности кода документаCIRIquant 31. Дополнительные данные также включают некоторые из основных команд, используемых в этом протоколе.

  1. Прогнозы циркРНК
    1. Сначала проиндексируйте эталонный геном хозяина с помощью элайнеров BWA и HISAT2. Затем на терминале Linux выполните команды bwa index 32 и hisat2-build33 в каталоге эталонного генома хоста, чтобы проиндексировать его.
    2. Затем подготовьте конфигурационный файл YML, содержащий имя файла, путь к инструментам (BWA, HISAT2, stringtie34, samtools35), путь к загруженным справочным файлам (файлы FASTA ссылочного генома хоста, файлы аннотаций) и путь к индексным файлам из шага 2.1.1.
    3. Запустите инструмент CIRIquant из терминала, используя параметры по умолчанию или вручную. Пользователь может указать тип библиотеки (цепочечный или нецепочечный) данных RNA-seq при выполнении инструмента CIRIquant.
      ПРИМЕЧАНИЕ: Тип библиотеки данных RNA-seq можно определить, зная тип используемого набора для подготовки библиотеки. Если идентификация набора для подготовки библиотеки неизвестна, для определения многоцепочечности данных РНК-секвенирования можно использовать биоинформатический пакет управления РНК-секвенированием под названием RSeQC36 .
  2. Анализ дифференциальных выражений
    ПРИМЕЧАНИЕ: Пакет CIRIquant включает в себя prep_CIRIquant, prepDE.py и CIRI_DE_replicate; Поэтому для этих трех инструментов не требуется никаких дополнительных загрузок.
    1. Подготовьте текстовый файл (LST) со списком данных, содержащим следующее:
      1-й столбец: идентификаторы данных RNA-seq, используемых на шаге 2.1.3
      2-й столбец: путь к файлам GTF, выведенным CIRIquant
      3-й столбец: группировка данных RNA-seq, независимо от того, является ли это контрольной или обработанной группой.
    2. В качестве примера см. таблицу 1 ниже.
      ПРИМЕЧАНИЕ: Нет необходимости вставлять заголовки, так как они предназначены только для справки.
    3. На терминале Linux запустите prep_CIRIquant с текстовым файлом (.lst), подготовленным на шаге 2.2.1 в качестве входных данных. При запуске будет сформирован список файлов: library_info.csv, circRNA_info.csv, circRNA_bsj.csv и circRNA_ratio.csv.
    4. Подготовьте второй текстовый файл со списком данных, содержащим идентификаторы RNA-seq и путь к их соответствующим выходным данным StringTie. Макет файла должен быть похож на текстовый файл на шаге 2.2.1 без столбца группировки.
    5. Запустите prepDE.py с текстовым файлом, подготовленным на шаге 2.2.4, в качестве входных данных для создания матричных файлов подсчета генов.
    6. Выполните CIRI_DE_replicate с файлами library_info.csv и circRNA_bsj.csv из шага 2.2.3 и gene_count_matrix.csv из шага 2.2.5 в качестве входных данных для вывода окончательного файла circRNA_de.tsv.
  3. Фильтрация цирковых РНК DE
    1. Используйте R (в компьютерном терминале или RStudio) или любое программное обеспечение для работы с электронными таблицами (например, Microsoft Excel), чтобы открыть файл circRNA_de.tsv , сгенерированный на шаге 2.2.6, для фильтрации и определения количества дифференциально экспрессируемых (DE) циркулярных РНК.
    2. Фильтруйте циркулярные РНК DE в соответствии с критериями LogFC > |2| и FDR < 0,05.
    3. Создайте файл с именем DE_circRNAs.txt для хранения информации о циркулярных РНК DE.

3. Характеристика и аннотация предсказанных ДЭ циркРНК

  1. Статус аннотации цирковых РНК DE
    1. Загрузите файл с именем DE_circRNAs.txt в RStudio, который состоит из списка циркулярных РНК DE, отфильтрованных из шага 2.3.3. Включите другую информацию, такую как положения генома (Chr, Start, End), ориентацию цепи (+ или -), название гена и тип циркулярной РНК. Прежде чем продолжить, преобразуйте начальные координаты генома циркРНК из CIRIquant в 0, вычитая 1 пару оснований.
      ПРИМЕЧАНИЕ: Другая информация, указанная выше, может быть получена из файлов GTF, выведенных CIRIquant (дополнительный файл 1).
    2. Определите статус аннотации предсказанных цирковых РНК DE, загрузив библиотеку, содержащую геномные позиции депонированных циркРНК в базе данных circRNA (например, circBase).
      ПРИМЕЧАНИЕ: Перед сравнением убедитесь, что версия генома, используемая для прогнозирования цирковых РНК, идентична библиотеке базы данных цирковых РНК. Файл данных circBase, используемый здесь, находится в свободном доступе в папке диска, предоставленной в Github (https://github.com/bicciatolab/Circr)37.
    3. После того, как оба файла из шагов 3.1.1 и 3.1.2 будут подготовлены, запустите сценарий R, приведенный в дополнительном файле 1. Хромосомные местоположения циркулярных РНК DE запрашиваются в библиотеке перед присвоением статуса «Аннотированный» или «Неаннотированный».
  2. Характеристика цирковых РНК DE
    1. Используйте R и другое программное обеспечение для работы с электронными таблицами, чтобы суммировать количество цирковых РНК в соответствии с типами цирковых РНК (т. е. экзон, интрон, интергенный и антисмысловый) и количество генов, через которые охватываются цирковые РНК (1 или >1) (дополнительный файл 1).ПРИМЕЧАНИЕ: CIRIquant может обнаруживать только четыре типа цирковых РНК (экзон, интрон, интергенный и антисмысловый). Экзон-интронные циркРНК, также известные как ElciRNA, не могут быть обнаружены CIRIquant.

4. Прогнозирование взаимодействия circRNA-miRNA с помощью Circr

ПРИМЕЧАНИЕ: Более подробное руководство по установке и использованию Circr для анализа взаимодействия circRNA-miRNA можно найти по адресу: https://github.com/bicciatolab/Circr37.

  1. Подготовка файлов
    1. Распакуйте и извлеките содержимое файла Circr.zip после его загрузки со страницы Circr GitHub с помощью соответствующего программного обеспечения, такого как «WinRar» или «7-zip», в новый каталог, где будет проводиться анализ.
    2. Установите необходимые программные приложения (miRanda, RNAhybrid, Pybedtools и samtools) перед проведением анализа circRNA-miRNA.
    3. Справочные геномы и файлы аннотаций для нескольких интересующих организмов, файл координат рРНК, проверенный файл взаимодействия микроРНК и файлы circRNA circBase предоставляются автором Circr на странице Github (https://github.com/bicciatolab/Circr)37. Нажав на вспомогательные файлы в папке диска, выберите папку для интересующего организма, папку miRNA и текстовый файл circBase и загрузите его.
    4. После загрузки необходимых файлов на шаге 4.1.3 создайте новый каталог с именем support_files в каталоге, указанном на шаге 4.1.1. Затем распакуйте и извлеките содержимое в каталог support_files .
    5. Проиндексируйте файл эталонного генома интересующего организма с помощью команды samtools faidx (дополнительный файл 1).
    6. Подготовьте входной файл, состоящий из координат интересующих DE circRNA, в файле BED с разделителями-табуляциями, как показано в таблице 2.
      ПРИМЕЧАНИЕ: Поскольку цирковые РНК, предсказанные CIRIquant, не основаны на 0, необходимо вычесть 1.н. в начальной координате (как указано в шаге 3.1.1), прежде чем преобразовывать их в формат BED. Заголовки, показанные в таблице 2 , приведены только для справки и не нужны в файлах BED.
    7. На этом этапе убедитесь, что ожидаемая структура дерева папок для анализа Circr соответствует рисунку 2.
  2. Запуск Circr.py
    1. Выполните Circr.py с помощью Python 3 и в качестве аргументов укажите входной файл circRNA, геном FASTA интересующего организма, версию генома выбранного организма, количество потоков и имя выходного файла в командной строке.
    2. Если интересующий организм не указан в папке диска, указанной на шаге 4.1.3, или если пользователь предпочитает иметь пользовательский набор файлов для выполнения анализа, при выполнении Circr.py необходимо включить дополнительные команды, указывающие местоположение этих файлов.
    3. После завершения анализа Circr программа выводит файл взаимодействия circRNA-miRNA в формате csv.
    4. Отфильтруйте результаты взаимодействия circRNA-miRNA в соответствии с предпочтениями пользователя. Для этого исследования прогнозы фильтруются с помощью Rstudio в соответствии с приведенными ниже критериями:
      -Обнаружено всеми тремя программными инструментами
      -Два или более сайтов привязки, о которых сообщают как Targetscan, так и miRanda.
      -Идентифицирован в столбцах «AGO» или «проверено»
      -Отфильтровать отсутствие взаимодействий с начальными областями
    5. Запишите цирковые РНК, которые передают отфильтрованные условия из шага 4.2.3, в новый текстовый файл с именем circRNA_miRNA.txt. Такая фильтрация может повысить достоверность предсказанных взаимодействий.

5. Построение сети цеРНК

ПРИМЕЧАНИЕ: Подробное руководство по использованию Cytoscape можно найти по адресу: http://manual.cytoscape.org/en/stable/ и https://github.com/cytoscape/cytoscape-tutorials/wiki#introduction

  1. Скачивание и подготовка
    1. Загрузите последнюю версию Cytoscape38 с: https://cytoscape.org/download.html.
    2. Запустите мастер установки, загруженный на шаге 5.1.1, и выберите расположение файла для программного обеспечения Cytoscape.
    3. Подготовьте файл с разделителями-табуляциями, содержащий интересующие циркРНК и их миРНК-мишень. Первый столбец состоит из названия циркРНК; во втором столбце указывается тип РНК из первого столбца; третий столбец – мишень-миРНК; а в четвертом столбце указан тип РНК из третьего столбца. Пример файла приведен в таблице 3.
  2. Построение карты сети цеРНК
    1. Откройте программное обеспечение Cytoscape, установленное на шаге 5.1.2.
    2. В Cytoscape перейдите в раздел «Файл» > «Импорт > сеть из файла». Выберите файл, подготовленный на шаге 5.1.3.
    3. На новой вкладке выберите первый и второй столбцы как «Исходный узел» и «Атрибут исходного узла», а третий и четвертый столбцы — «Целевой узел» и «Атрибут целевого узла» соответственно. Нажмите OK, и сеть появится в правом верхнем углу Cytoscape.
    4. Чтобы изменить визуальный стиль сети, нажмите кнопку «Стиль » в левой части Cytoscape.
    5. Нажмите стрелку справа от параметра «Цвет заливки». Выберите « Тип » для столбца и «Дискретное сопоставление» для типа сопоставления . Затем выберите желаемый цвет для каждого из типов РНК.
    6. После изменения цвета измените форму узлов, перейдя в раздел «Форма » и выполнив шаг 5.2.5.

6. Анализ функционального обогащения

  1. Анализ генной онтологии (GO) и Киотской энциклопедии генов и геномов (KEGG) для родительского гена циркРНК
    1. Убедитесь, что clusterProfiler 39,40 и org. Hs.eg.db В Rstudio установлен 41 пакет. Орг. Пакет Hs.eg.db41 - это полногеномный пакет аннотаций только для людей. Если интересующим организмом является другой вид, обратитесь к: https://bioconductor.org/packages/release/BiocViews.html#OrgDb
    2. Импортируйте информацию о DE_circRNA из шага 2.3.1 в рабочую область Rstudio.
    3. Используйте родительский ген цирковых РНК, представленных в этом файле, для анализа обогащения на следующих этапах. Однако, если пользователь хочет преобразовать символ гена в другие форматы, такие как Entrez ID, используйте такую функцию, как «bitr».
    4. Используя идентификатор гена в качестве входных данных, запустите анализ обогащения GO с помощью функции enrichGO в пакете clusterProfiler39,40 с параметрами по умолчанию.
    5. Используя идентификатор гена в качестве входных данных, запустите анализ обогащения KEGG с помощью функции enrichKEGG в пакете clusterProfiler39,40, используя параметры по умолчанию.

Результаты

Протокол, перечисленный в предыдущем разделе, был изменен и настроен в соответствии с системой ОС Linux. Основная причина заключается в том, что большинство библиотек модулей и пакетов, участвующих в анализе circRNA, могут работать только на платформе Linux. В этом анализе деидентифицированные ...

Обсуждение

Чтобы проиллюстрировать полезность этого протокола, в качестве примера использовали РНК-секвенирование из инфицированных вирусом гриппа А клеток макрофагов человека. Были исследованы циркРНК, функционирующие как потенциальные губки микроРНК во взаимодействиях хозяин-патоген, и их ?...

Раскрытие информации

Авторам раскрывать нечего.

Благодарности

Автор хотел бы поблагодарить Тан Ке Эн и доктора Кэмерона Брэкена за их критическую рецензию на эту рукопись. Эта работа была поддержана грантами Схемы грантов на фундаментальные исследования (FRGS/1/2020/SKK0/UM/02/15) и Исследовательского гранта Университета Малайи (UM. C/625/1/HIR/MOE/CHAN/02/07).

Материалы

NameCompanyCatalog NumberComments
BedtoolsGitHubhttps://github.com/arq5x/bedtools2/Referring to section 4.1.2. Needed for Circr.
BWABurrows-Wheeler Alignerhttp://bio-bwa.sourceforge.net/Referring to section 2.1.1 and 2.1.2. Needed to run CIRIquant, and to index the genome
CircrGitHubhttps://github.com/bicciatolab/CircrReferring to section 4. Use to predict the miRNA binding sites
CIRIquantGitHubhttps://github.com/bioinfo-biols/CIRIquantReferring to section 2.1.3. To predict circRNAs
ClusterprofilerGitHubhttps://github.com/YuLab-SMU/clusterProfilerReferring to section 7. For GO and KEGG functional enrichment
CPUIntel Intel(R) Xeon(R) CPU E5-2620 V2 @ 2.10 GHz   Cores: 6-core CPU Memory: 65 GB Graphics card: NVIDIA GK107GL (QUADRO K2000) Specifications used to run this entire protocol.
CytoscapeCytoscapehttps://cytoscape.org/download.htmlReferring to section 5.2. Needed to plot ceRNA network
FastQCBabraham Bioinformaticshttps://www.bioinformatics.babraham.ac.uk/projects/fastqc/Referring to section 1.2.1. Quality checking on Fastq files
HISAT2http://daehwankimlab.github.io/hisat2/Referring to section 2.1.1 and 2.1.2. Needed to run CIRIquant, and to index the genome
LinuxUbuntu 20.04.5 LTS (Focal Fossa)https://releases.ubuntu.com/focal/Needed to run the entire protocol. Other Ubuntu versions may still be valid to carry out the protocol.
miRandahttp://www.microrna.org/microrna/getDownloads.doReferring to section 4.1.2. Needed for Circr
Pybedtoolspybedtools 0.8.2https://pypi.org/project/pybedtools/Needed for BED file genomic manipulation
PythonPython 2.7 and 3.6 or aboverhttps://www.python.org/downloads/To run necessary library modules
RThe Comprehensive R Archive Networkhttps://cran.r-project.org/To manipulate dataframes
RNAhybridBiBiServhttps://bibiserv.cebitec.uni-bielefeld.de/rnahybridReferring to section 4.1.2. Needed for Circr
RStudioRStudiohttps://www.rstudio.com/A workspace to run R
samtools SAMtoolshttp://www.htslib.org/Referring to section 2.1.2. Needed to run CIRIquant
StringTieJohns Hopkins University: Center for Computational Biologyhttp://ccb.jhu.edu/software/stringtie/index.shtmlReferring to section 2.1.2. Needed to run CIRIquant
TargetScanGitHubhttps://github.com/nsoranzo/targetscanReferring to section 4.1.2. Needed for Circr

Ссылки

  1. Raman, K., Bhat, A. G., Chandra, N. A systems perspective of host-pathogen interactions: predicting disease outcome in tuberculosis. Molecular BioSystems. 6 (3), 516-530 (2010).
  2. Casadevall, A., Pirofski, L. A. Host-pathogen interactions: basic concepts of microbial commensalism, colonization, infection, and disease. Infection and Immunity. 68 (12), 6511-6518 (2000).
  3. Yang, E., Li, M. M. H. All About the RNA: Interferon-stimulated genes that interfere with viral RNA processes. Frontiers in Immunology. 11, 605024 (2020).
  4. Schneider, W. M., Chevillotte, M. D., Rice, C. M. Interferon-stimulated genes: A complex web of host defenses. Annual Review of Immunology. 32 (1), 513-545 (2014).
  5. Shirahama, S., Miki, A., Kaburaki, T., Akimitsu, N. Long non-coding RNAs involved in pathogenic infection. Frontiers in Genetics. 11, 454 (2020).
  6. Chandan, K., Gupta, M., Sarwat, M. Role of host and pathogen-derived microRNAs in immune regulation during infectious and inflammatory diseases. Frontiers in Immunology. 10, 3081 (2019).
  7. Chen, X., et al. Circular RNAs in immune responses and immune diseases. Theranostics. 9 (2), 588-607 (2019).
  8. Kristensen, L. S., et al. The biogenesis, biology and characterization of circular RNAs. Nature Reviews Genetics. 20 (11), 675-691 (2019).
  9. Ashwal-Fluss, R., et al. circRNA biogenesis competes with pre-mRNA splicing. Molecular Cell. 56 (1), 55-66 (2014).
  10. Conn, S. J., et al. The RNA binding protein quaking regulates formation of circRNAs. Cell. 160 (6), 1125-1134 (2015).
  11. Zhang, X. O., et al. Complementary sequence-mediated exon circularization. Cell. 159 (1), 134-147 (2014).
  12. Robic, A., Demars, J., Kuhn, C. In-depth analysis reveals production of circular RNAs from non-coding sequences. Cells. 9 (8), 1806 (2020).
  13. Eger, N., Schoppe, L., Schuster, S., Laufs, U., Boeckel, J. N. Circular RNA splicing. Advances in Experimental Medicine and Biology. 1087, 41-52 (2018).
  14. Barrett, S. P., Wang, P. L., Salzman, J. Circular RNA biogenesis can proceed through an exon-containing lariat precursor. eLife. 4, 07540 (2015).
  15. Memczak, S., et al. Circular RNAs are a large class of animal RNAs with regulatory potency. Nature. 495 (7441), 333-338 (2013).
  16. Misir, S., Wu, N., Yang, B. B. Specific expression and functions of circular RNAs. Cell Death and Differentiation. 29 (3), 481-491 (2022).
  17. Bai, S., et al. Construct a circRNA/miRNA/mRNA regulatory network to explore potential pathogenesis and therapy options of clear cell renal cell carcinoma. Scientific Reports. 10 (1), 13659 (2020).
  18. Sakshi, S., Jayasuriya, R., Ganesan, K., Xu, B., Ramkumar, K. M. Role of circRNA-miRNA-mRNA interaction network in diabetes and its associated complications. Molecular Therapy - Nucleic Acids. 26, 1291-1302 (2021).
  19. Hansen, T. B., et al. miRNA-dependent gene silencing involving Ago2-mediated cleavage of a circular antisense RNA. The EMBO Journal. 30 (21), 4414-4422 (2011).
  20. Lu, M. Circular RNA: functions, applications, and prospects. ExRNA. 2 (1), 15 (2020).
  21. Liu, K. S., Pan, F., Mao, X. D., Liu, C., Chen, Y. J. Biological functions of circular RNAs and their roles in occurrence of reproduction and gynecological diseases. American Journal of Translational Research. 11 (1), 1-15 (2019).
  22. Pamudurti, N. R., et al. Translation of CircRNAs. Molecular Cell. 66 (1), 9-21 (2017).
  23. Legnini, I., et al. Circ-ZNF609 Is a circular RNA that can be translated and functions in myogenesis. Molecular Cell. 66 (1), 22-37 (2017).
  24. Weigelt, C. M., et al. An insulin-sensitive circular RNA that regulates lifespan in Drosophila. Molecular Cell. 79 (2), 268-279 (2020).
  25. Guo, Y., et al. Identification and characterization of circular RNAs in the A549 cells following Influenza A virus infection. Veterinary Microbiology. 267, 109390 (2022).
  26. Qu, Z., et al. A novel intronic circular RNA antagonizes influenza virus by absorbing a microRNA that degrades CREBBP and accelerating IFN-β production. mBio. 12 (4), 0101721 (2021).
  27. Kawarada, Y., et al. TGF-β induces p53/Smads complex formation in the PAI-1 promoter to activate transcription. Scientific Reports. 6 (1), 35483 (2016).
  28. Yu, T., et al. Circular RNA GATAD2A promotes H1N1 replication through inhibiting autophagy. Veterinary Microbiology. 231, 238-245 (2019).
  29. FastQC: A quality control tool for high throughput sequence data. Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ (2010)
  30. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  31. Zhang, J., Chen, S., Yang, J., Zhao, F. Accurate quantification of circular RNAs identifies extensive circular isoform switching events. Nature Communications. 11 (1), 90 (2020).
  32. Li, H., Durbin, R. Fast and accurate long-read alignment with Burrows-Wheeler transform. Bioinformatics. 26 (5), 589-595 (2010).
  33. Kim, D., Paggi, J. M., Park, C., Bennett, C., Salzberg, S. L. Graph-based genome alignment and genotyping with HISAT2 and HISAT-genotype. Nature Biotechnology. 37 (8), 907-915 (2019).
  34. Pertea, M., et al. StringTie enables improved reconstruction of a transcriptome from RNA-seq reads. Nature Biotechnology. 33 (3), 290-295 (2015).
  35. Li, H., et al. The Sequence Alignment/Map format and SAMtools. Bioinformatics. 25 (16), 2078-2079 (2009).
  36. Wang, L., Wang, S., Li, W. RSeQC: quality control of RNA-seq experiments. Bioinformatics. 28 (16), 2184-2185 (2012).
  37. Dori, M., Caroli, J., Forcato, M. Circr, a computational tool to identify miRNA:circRNA associations. Frontiers in Bioinformatics. 2, 852834 (2022).
  38. Shannon, P., et al. Cytoscape: a software environment for integrated models of biomolecular interaction networks. Genome Research. 13 (11), 2498-2504 (2003).
  39. Wu, T., et al. clusterProfiler 4.0: A universal enrichment tool for interpreting omics data. The Innovation. 2 (3), 100141 (2021).
  40. Yu, G., Wang, L. G., Han, Y., He, Q. Y. clusterProfiler: an R package for comparing biological themes among gene clusters. OMICS: A Journal of Integrative Biology. 16 (5), 284-287 (2012).
  41. . org.Hs.eg.db: Genome wide annotation for human. 2022. R package version 3.15.0 Available from: https://bioconductor.org/packages/release/data/annotation/html/org.Hs.eg.db.html (2022)
  42. Barrett, T., et al. NCBI GEO: archive for functional genomics data sets-update. Nucleic Acids Research. 41, 991-995 (2012).
  43. Gao, Y., Zhang, J., Zhao, F. Circular RNA identification based on multiple seed matching. Briefings in Bioinformatics. 19 (5), 803-810 (2018).
  44. Zhang, X. O., et al. Diverse alternative back-splicing and alternative splicing landscape of circular RNAs. Genome Research. 26 (9), 1277-1287 (2016).
  45. Memczak, S., et al. Circular RNAs are a large class of animal RNAs with regulatory potency. Nature. 495 (7441), 333-338 (2013).
  46. Wang, K., et al. MapSplice: Accurate mapping of RNA-seq reads for splice junction discovery. Nucleic Acids Research. 38 (18), 178 (2010).
  47. Song, X., et al. Circular RNA profile in gliomas revealed by identification tool UROBORUS. Nucleic Acids Research. 44 (9), 87 (2016).
  48. Hansen, T. B. Improved circRNA identification by combining prediction algorithms. Frontiers in Cell and Developmental Biology. 6, 20 (2018).
  49. Robinson, M. D., McCarthy, D. J., Smyth, G. K. edgeR: A bioconductor package for differential expression analysis of digital gene expression data. Bioinformatics. 26 (1), 139-140 (2010).
  50. Ma, X. K., et al. CIRCexplorer3: A CLEAR pipeline for direct comparison of circular and linear RNA expression. Genomics Proteomics Bioinformatics. 17 (5), 511-521 (2019).
  51. Gaffo, E., Buratin, A., Dal Molin, A., Bortoluzzi, S. Sensitive, reliable and robust circRNA detection from RNA-seq with CirComPara2. Briefings in Bioinformatics. 23 (1), (2022).
  52. Glažar, P., Papavasileiou, P., Rajewsky, N. circBase: a database for circular RNAs. RNA. 20 (11), 1666-1670 (2014).
  53. Tan, S., et al. Circular RNA F-circEA-2a derived from EML4-ALK fusion gene promotes cell migration and invasion in non-small cell lung cancer. Molecular Cancer. 17 (1), 138 (2018).
  54. Guarnerio, J., et al. Oncogenic role of Fusion-circRNAs Derived from cancer-associated chromosomal translocations. Cell. 165 (2), 289-302 (2016).
  55. McGeary, S. E., et al. The biochemical basis of microRNA targeting efficacy. Science. 366 (6472), (2019).
  56. Enright, A. J., et al. MicroRNA targets in Drosophila. Genome Biology. 5 (1), 1 (2003).
  57. Rehmsmeier, M., Steffen, P., Hochsmann, M., Giegerich, R. Fast and effective prediction of microRNA/target duplexes. RNA. 10 (10), 1507-1517 (2004).
  58. Zhang, D., et al. AllEnricher: a comprehensive gene set function enrichment tool for both model and non-model species. BMC Bioinformatics. 21 (1), 106 (2020).
  59. Zhou, Y., et al. Metascape provides a biologist-oriented resource for the analysis of systems-level datasets. Nature Communications. 10 (1), 1523 (2019).

Перепечатки и разрешения

Запросить разрешение на использование текста или рисунков этого JoVE статьи

Запросить разрешение

Смотреть дополнительные статьи

188

This article has been published

Video Coming Soon

JoVE Logo

Исследования

Образование

О JoVE

Авторские права © 2025 MyJoVE Corporation. Все права защищены