Мы используем генетическое секвенирование вирусов, чтобы попытаться понять, откуда и как они распространяются. И для того, чтобы использовать эти данные в режиме реального времени, например во время вспышки, мы должны точно понимать, насколько точны данные, которые мы предоставляем. Основные преимущества этих методов в том, что это относительно дешево, это быстро, и это позволяет в режиме реального времени базового кодирования, которые могут быть использованы для последовательности поля.
Этот метод может быть использован для своевременного генерации данных последовательности, которые, например, могут быть использованы для определения происхождения множества патогенов. Этот метод может быть сложным для пользователей впервые и основные знания Unix не требуется. Специально для установки различных программных пакетов.
Визуализация этого метода поможет пользователям определить скорость ошибок их конкретных протоколов секвенирования. И ответить на исследовательские вопросы. Запуск последовательности запущен на MinION, подключенном к MinIT.
После предварительной разработки последовательности на платформе Nanopore загрузите нагрузку данных в Porechop. Чтобы предотвратить загрязнение и повысить точность, используйте требуют подчеркнуть два, подчеркнуть штрих-коды флаг и ввести команду, как указано. После де-мультиплексирования используйте cutadapt для удаления грунтовых последовательностей и последовательностей длиной короче 75 нуклеотидов, используя команду, как указано.
Используйте Minimap2 для отображения де-мультиплекса последовательность читает против панели различных штаммов ссылки с помощью Minimap2. И использовать Samtools для создания последовательности консенсуса. Для выравнивания на основе ссылки необходимо предварительно проформировать взрыв и поиск с генерируемой последовательностью консенсуса для определения ближайшего штамма ссылки.
Затем повторите выравнивание на основе ссылки с ближайшим эталоном штамма в качестве ссылки. Чтобы определить требуемое покрытие чтения, чтобы компенсировать профиль ошибки в секвенировании Nanopore, выберите последовательность отображения на один Amplicon и использовать Minimap2 для отображения Nanopore читает против этого Amplicon. Используйте Samtools, чтобы выбрать только считывает отображение Amplicon26 и преобразовать бам файл в fastq с помощью команд, как указано.
Случайно выбранные подмножества, например, 200 последовательностей читается тысячу раз. Все случайно выбранные последовательности считы приведены в соответствие с Amplicon26. Используйте KMA для картирования считывания последовательности и немедленного создания последовательности консенсуса с использованием оптимизированных параметров для секвенирования Nanopore, как указано нано-флагом до н.э.
Для проверки генерируемых последовательностей консенсуса используйте команды, как указано. Для отображения скорости ошибок в статистике точка txt под заголовком, уровень ошибок несоответствия базы отображаются, используйте команду, как указано. Для отображения количества indels отображается под заголовком indels за цикл использовать команду, как указано.
Использование новой ячейки потока в сочетании с флип-флопом базового цвета, считывания покрытия 40 раз приводит к идентичным результатам по сравнению с секвенированием Illumina. Чтение покрытия 30 раз приводит к ошибке 0,02%, что соответствует одной ошибке в каждые 585 000 нуклеотидов последовательности. В то время как чтение охвата 20 раз приводит к одной ошибке в каждом 63, 529 нуклеотидов последовательности.
Чтение охвата 10 раз приводит к одной ошибке в каждом 3, 312 нуклеотидов последовательности. Это означает, что более 3 нуклеотидов на четыре генома вируса Усуту называют неправильными. При считывом покрытии выше 30 раз, никаких indels не наблюдается.
Чтение охвата 20 раз приводит к обнаружению одного indel позиции в то время как читать освещение 10 раз приводит к indels в 29 позиций. Самое главное помнить, что, хотя и не всегда очевидно, обновления в программном обеспечении происходят часто и может повлиять на результаты. Существует несколько вариантов использования программного обеспечения.
Мы продемонстрировали наиболее часто используемые программы. Но различное программное обеспечение и различные версии этих программ могут привести к различным результатам. Мы показали вам пример того, как мы проверяем качество данных последовательности, которые мы генерируем.
И это имеет решающее значение для надежной поддержки вспышки.