miRDeep2 может быть использован для точного определения микроРНК растений, которые являются важными транскрипционными регуляторами в развитии растений и имеют решающее значение для реагирования на экологические проблемы. miRDeep2 требует заметно короткого времени работы и демонстрирует отличную производительность как в чувствительности, так и в точности, особенно для прогнозирования микроРНК у растений с большим геномом. Ложные срабатывания и длительное время обработки являются проблемами в аннотации микроРНК растений.
Добавив новую стратегию полевых исследований, пересмотр алгоритма скоринга и интеграцию строгих критериев, miRDeep2 может преодолеть эти проблемы. Высококотреть микроРНК имеет основополагающее значение для открытия роли микроРНК в регулировании разнообразной функции генома. Пошаговое руководство может быть полезным для первого времени микроРНК аннотаторов.
Для опытных исследователей, метод полезен для понимания преимуществ и преимуществ использования miRDeep2 по сравнению с другими инструментами. Чтобы установить пакет miRDeep2, перейдите на веб-страницу miRDeep2 и возьмите файлы tarball. Затем извлеките все содержимое загруженного файла в одну папку и установите путь папки к пути.
Чтобы протестировать конвейер miRDeep2, загрузите тестовые данные и ожидаемый выход, содержащий один отформатированный файл секвенирования GSM и один файл генома Arabidopsis thaliana, и переместите все загруженные файлы в текущий рабочий каталог. После извлечения сжатых файлов тарбола, создайте справочный индекс генома Arabidopsis и некодирующий эталонный индекс РНК. Папка будет автоматически сгенерирована в user_selected_folder содержащий все промежуточные файлы и результаты.
Конвейер miRDeep2 может быть запущен с использованием тестовых данных. Чтобы проверить результаты тестирования, просмотрите файл вывода, делимитированную вкладку. Окончательный выход прогнозируемых микроРНК будет содержать столбцы, указывающие на идентификатор хромосомы, направление нити, представитель читает ID, идентификатор прекурсора, зрелое местоположение миРНК, местоположение предшественника, зрелую последовательность и последовательность прекурсоров.
Затем проверьте файл progress_log который предоставляет информацию о готовых шагах и файлах script_log и script_err, которые содержат результаты программы и предупреждения. Перед запуском конвейера, чтобы убедиться, что входные считывания предварительно обработаны в надлежащий формат, удалите адаптеры из пяти и трех основных концов глубокого секвенирования и убедитесь, что все идентификаторы FAST A уникальны. Каждый идентификатор последовательности должен закончиться подчеркивания x и integer с указанием номера копии точной последовательности, которая была извлечена в глубоких наборов данных секвенирования.
Чтобы обеспечить уникальный идентификатор FAST A, включите бегущее число в индекс ID.To создайте эталонный индекс, если были проиндексированы последовательности генома видов, представляющих интерес, загрузите файлы индекса Bowtie 2 с веб-сайта iGenomes. Затем создайте немифлорный некодирующий РНК-индекс, содержащий основные некодирующие последовательности РНК-фама, включая рибосомную РНК, рнк передачи, небольшую ядерную РНК и небольшую нуклеолярную РНК для фильтрации шумных последовательностей из других некодирующих фрагментов РНК. Чтобы использовать miRDeep2 для обнаружения новых микроРНК из данных глубокого секвенирования, запустите скрипт bash в пакете для запуска конвейера анализа.
Количество различных мест чтения может быть отображено, число несоответствий для запуска Bowtie 2 и порог чтения на миллион могут быть изменены по мере необходимости. Чтобы проверить выходы miRDeep2, просмотрите данные в автоматически сгенерированном output_folder. В этом репрезентативном анализе, miRDeep2 микроРНК аннотации трубопровода была применена к 10 публичных библиотек последовательности сРНК из пяти видов растений с постепенно увеличенным размером генома, как указано.
Для каждого вида две репрезентативные небольшие РНК-библиотеки из разных тканей и их последовательности индексного генома обрабатываются в виде двух входных данных. Используя предыдущие методы, обработка генома может занять более 100 часов или иногда останавливается в середине анализа из-за длины генома. miRDeep2, однако, закончить эти процессы прогнозирования в заметно более короткий период времени от минут до часов.
Для двух секвенирований Arabidopsis малых РНК, используемых в этом тесте, miRDeep2 выполняется лучше как чувствительность и точность по сравнению с другими инструментами. Пожалуйста, убедитесь, что входной индекс для программы является правильным. Например, используйте Bowtie только с индексом Bowtie и используйте большой параметр индекса для больших геномов.
Цели полученной микроРНК можно предсказать с помощью данных секвенирования, которые могут дать представление о функции микроРНК. Поскольку miRDeep2 может быть использован для точной и чувствительной идентификации большинства микроРНК в определенном виде растений, можно изучить роль функции микроРНК в целом.