Кольцевые РНК играют важную регуляторную роль в различных биологических процессах. Этот протокол подходит новичкам для проведения кольцевого анализа РНК в области взаимодействия хозяина и патогена. Здесь мы собрали несколько инструментов, создающих оптимизированный протокол, необходимый для безопасного прогнозирования и количественного определения РНК, безопасного функционального обогащения РНК, безопасного прогнозирования взаимодействия микро-РНК и построения сети РНК CCE.
Этот упрощенный протокол может быть применен к клиническим образцам для идентификации определенных кандидатов, диагностических и прогностических значений в условиях взаимодействия хозяина и патогена. Я ожидаю, что те, у кого нет предварительных знаний в области программирования, будут испытывать трудности на начальном этапе этой техники. Поэтому я бы посоветовал изучить основы языков программирования, используемых в этой технике.
Я считаю, что обычно взгляд на то, как применяется язык программирования, более информативный и простой для понимания по сравнению с чтением в одиночку. Для начала откройте терминал Linux и в каталоге эталонного генома хоста выполните команды bwa index и hisat2-build для индексации генома. Подготовьте конфигурационный файл yml, содержащий имя файла, путь к инструментам, путь к загруженным справочным файлам и путь к индексным файлам.
Укажите тип библиотеки данных последовательности РНК и запустите инструмент Ciriquant, используя параметры по умолчанию или вручную. Подготовьте текстовый файл со списком данных, содержащих идентификаторы данных последовательности РНК, путь к файлам GTF, выводимым Ciriquant, и группировку данных последовательности РНК, независимо от того, является ли это контрольной или обработанной группой. На терминале Linux запустите prep_Ciriquant с подготовленным текстовым файлом в качестве входных данных.
Этот запуск сгенерирует список файлов. Подготовьте второй текстовый файл со списком данных, содержащих идентификаторы последовательностей РНК и путь к их соответствующим выходным данным. Макет файла должен быть похож на ранее подготовленный текстовый файл без запуска столбца группировки.
Запустите prepde. py с этим текстовым файлом в качестве входных данных для создания матричных файлов подсчета генов. Выполните Ciri_DE_Replicate с помощью library_info.
CSV, circRNA_BSJ. CSV и gene_count_matrix. CSV-файлы в качестве входных данных для вывода окончательного circRNA_DE.
TSV-файл. Чтобы отфильтровать и определить количество дифференциально экспрессируемых, или DE, циркулярных РНК, откройте circRNA_DE. tsv с R или любым другим программным обеспечением для работы с электронными таблицами.
Распакуйте и извлеките содержимое файла CircR после его загрузки со страницы CircR GitHub с помощью соответствующего программного обеспечения, такого как WinRar или 7-Zip. В новый каталог, где будет проводиться анализ. Затем установите необходимые программные приложения, такие как SAMTools, miRanda, RNAhybrid и Pybedtools, прежде чем проводить анализ микроРНК circRNA.
Проиндексируйте файл эталонного генома интересующего организма с помощью команды SAMtools FAIDX и подготовьте входной файл, состоящий из координат интересующих DE circRNA, в файле слоя с разделителями-вкладками. Затем выполните Circr. py с использованием Python3.
А в качестве аргументов укажите входной файл circRNA, более быстрый геном интересующего организма, версию генома выбранного организма, количество потоков и имя выходного файла в командной строке. После завершения анализа Circr программа выводит файл взаимодействия circRNA-miRNA в формате CSV. Подготовьте файл с разделителями-вкладками, содержащий интересующие циркРНК и их миРНК-мишень.
Первый столбец состоит из названия circRNA. Во втором столбце указывается тип РНК из первого столбца. Третий столбец — мишень-миРНК.
А в четвертом столбце указывается тип РНК из третьего столбца. Чтобы построить карту сети цеРНК, откройте программное обеспечение Cytoscape, перейдите к файлу, импорту, сети из файла, выберите подготовленный файл и загрузите его. Нажмите кнопку стиля, чтобы изменить визуальный стиль сети.
Затем нажмите стрелку справа от цвета заливки, выберите тип для столбца, дискретное отображение для типа отображения и выберите желаемый цвет для каждого типа РНК. После этого перейдите к фигуре, чтобы изменить форму узлов, и выполните шаги, показанные ранее. Для онтологии генов и KEGG-анализа родительского гена циркРНК обеспечьте профилировщик кластеров и орг. Hs.eg.
Пакеты БД были установлены в нашей студии. Импортируйте информацию о циркулярной РНК DE в рабочую область R studio. Если пользователь хочет преобразовать имена родительских генов в другие форматы, такие как энтрезид, используйте такую функцию, как bidder.
Используйте идентификатор гена в качестве входных данных и запустите анализ онтологии и обогащения гена с помощью функции enrichGO в профиле кластера или пакете с параметрами по умолчанию. Наконец, запустите анализ обогащения KEGG, используя идентификатор гена в качестве входных данных и функцию enrichKEGG в пакете профилировщика кластера. На этом рисунке показан пузырьковый график анализа обогащения онтологии генов родительских генов DE circRNA.
Соотношение генов по оси x — это количество генов в этом входном списке, связанных с данным термином онтологии генов, деленное на общее количество генов в этом термине. Размер точки на графике представлен значением count, которое представляет собой количество генов во входном списке, связанных с данным термином онтологии гена. Чем больше размер точек, тем больше количество входных генов, связанных с термином.
Точки на графике имеют цветовую кодировку на основе pvalue, которое вычисляется путем сравнения наблюдаемой частоты термина аннотации с частотой, ожидаемой случайно. Обогащение является статистически значимым и отображается на пузырьковом графике только в том случае, если pvalue меньше 0,01. Здесь три основных обогащения биологических процессов включают биогенез рибонуклеопротеинового комплекса, реакцию на вирус и регуляцию реакции на биотический стимул.
В то время как для молекулярных функций статистически обогащена только каталитическая активность, действующая на РНК и связывание одноцепочечной РНК. Для клеточных компонентов статистически обогащен только ретромерный комплекс. На этом репрезентативном изображении показан анализ обогащения KEGG родительских генов циркулярной РНК DE на пузырьковом графике.
В этом случае были обогащены только два термина KEGG: пути жизненного цикла гриппа А и вирусного жизненного цикла. Одна из самых важных вещей при попытке этой процедуры - убедиться, что правильный тип признака набора данных РНК circ, который вы используете при выполнении травмы. Представленный здесь биоформатный конвейер помогает прогнозировать потенциальные вековые РНК и функциональные аннотации.
Тем не менее, для получения убедительных доказательств по-прежнему потребуется хорошо организованная проверка. Этот протокол позволит исследователям обнаружить безопасную РНК и их потенциальную функциональную роль в различных кодах и взаимодействиях патогенов, которые они могут дополнительно изучить.