Этот всеобъемлющий протокол инструктирует, как генерировать близкие геномы различных мочевых бактерий и позволяет читателям, не имеющим опыта кодирования, успешно внедрять конвейеры сборки и анализа генома на основе терминалов. Полные сборки генома позволяют обнаружить гены, способствующие колонизации и вирулентности среди комменсальных и уропатогенных бактерий. Близкие геномы дают представление об архитектуре генома и мобильных генетических элементах.
Метод сборки гибридного генома может быть применен к любым культивируемым бактериям, выделенным из других анатомических участков или экологических ниш, чтобы обеспечить аналогичное понимание содержания и архитектуры генома. Следуйте протоколу и руководству производителя, чтобы подготовить двухцепочечный пул ДНК и приступить к очистке, добавив в 2,5 раза больший объем парамагнитных шариков в пул ДНК, а затем осторожно щелкнув трубкой, чтобы смешать содержимое. Кратковременно вращайте образец в 2000 раз G и поместите образец на ротатор в течение пяти минут при комнатной температуре, затем гранулируйте шарики на магните.
Затем дважды промыть гранулу 250 микролитрами свежеприготовленного 70% этанола в воде без нуклеазы, не нарушая гранулу. Оставляйте трубку на магните во время стирки. Аспират этанола после каждой промывки, затем ненадолго вращайте образец в 2000 раз g, прежде чем вернуть его на магнит.
Пипетка снимает остаточный этанол и дает грануле высохнуть в течение 30 секунд. После высушивания повторно суспендируйте гранулу в 60-70 микролитрах воды без нуклеазы и инкубируйте образец при комнатной температуре в течение двух минут, затем гранулируйте образец на магните до тех пор, пока элюд не станет прозрачным. Переложите элют в чистую микроцентрифужную трубку объемом 1,5 миллилитра.
Количественно оцените концентрированный двухцепочечный пул ДНК с помощью флуорометра, затем подготовьте аликвоту в 700 нанограммов образца в конечном объеме 65 микролитров, чтобы перейти к этапу лигирования адаптера и сохранить оставшуюся часть пула при четырех градусах Цельсия для второго запуска после завершения первого запуска. Продолжайте перевязку адаптера в соответствии с инструкциями производителя. Чтобы продолжить секвенирование, смешайте буферы грунтования и загрунтуйте проточную ячейку.
Подготовьте решение библиотеки ДНК и загрузите образец по каплям в загрузочный порт. Запустите запуск виртуализации. Откройте операционное программное обеспечение для секвенирования и нажмите кнопку «Пуск», затем введите имя эксперимента.
Перейдите к продолжению выбора комплекта, чтобы выбрать соответствующий комплект для подготовки библиотеки и пакет расширения штрих-кода, а затем нажмите «Продолжить», чтобы запустить параметры. Если планируется подготовить достаточную библиотеку для второго запуска, измените продолжительность выполнения с 72 часов по умолчанию до 48 часов и нажмите кнопку Продолжить, чтобы перейти к базовому вызову. Проверьте опцию basecalling в config fast basecalling.
Установите штрихкодирование включенным, чтобы выходной FASTQ был обрезан от последовательностей штрих-кодов и де-мультиплексирован в отдельные каталоги на основе штрих-кода. Нажмите на кнопку Продолжить вывод. Затем выберите, где сохранить выходные данные секвенирования.
Ожидайте примерно от 30 до 50 гигабайт данных, если только сохранить выходные данные FASTQ, и более 500 гигабайт данных при сохранении выходных данных FAST5. Если планируется продолжить ручную фильтрацию после виртуализации, снимите флажок фильтра Qscore семь в длине чтения без фильтрации. В противном случае оставьте этот параметр отмеченным.
Перейдите на вкладку Продолжить запуск установки, чтобы просмотреть все настройки. Если настройки верны, нажмите на кнопку пуск. В противном случае нажмите на кнопку «Назад», чтобы внести необходимые коррективы.
В каталоге long reads создайте новые каталоги для каждого штрих-кода, используемого в запуске. Скопируйте все файлы fastq, соответствующие каждому штрих-коду, в соответствующую папку. Объедините все файлы fastq для каждого штрих-кода с каждого запуска.
После объединения файлов откройте терминал и перейдите к каталогам штрих-кодов в каталоге длительного чтения с помощью команды cd. Чтобы объединить все файлы fastq для каждого штрих-кода в один файл fastq, выполните команду и повторите процедуру для каждого штрих-кода. Используйте NanoStat для оценки качества чтения образца путем выполнения команды, а затем запишите результаты, скопировав выходные данные в текстовый файл или файл Word для дальнейшего использования.
После сохранения результатов используйте NanoFilt для фильтрации чтения MinION, отбрасывая чтения с Q меньше семи и длиной менее 200 путем выполнения команды. В сгенерированном обрезанном файле запустите NanoStat с помощью команды. Запишите результаты, скопировав выходные данные в текстовый файл или файл Word, и сравните с предыдущими результатами, чтобы убедиться, что фильтрация прошла успешно.
Повторите шаги для каждого штрихкода, используемого в цикле виртуализации. Для создания гибридной сборки генома организуйте файлы короткого чтения и длинные файлы чтения в одном каталоге с именем trimmed_reads. Таким образом, каталог содержит ранее сгенерированный fastq.
gz файл для обрезанных длинных чтений и двух fastq. файлы gz в виде R1 и R2 для обрезанного короткого чтения. Перейдите в trimmed_reads каталога, в котором хранятся прочитанные файлы, с помощью команды cd в терминале.
Оказавшись в правильном каталоге, заархивируйте два коротких прочитанных файла для хранения в fastq. Форматирование gz путем выполнения команды. Повторите этот шаг для R1 и R2. Убедитесь, что все прочитанные файлы находятся в fastq.
формат gz и убедитесь, что все файлы соответствуют одному и тому же изоляту. Начните гибридную сборку с помощью Unicycler, выполнив команду. Когда запуск будет завершен, просмотрите однопроцессорный велосипед.
файл журнала, чтобы убедиться в отсутствии ошибок. Запишите количество, размер и полное или неполное состояние созданного контекста. Если в журнале Unicycler обнаружены неполные контексты, повторно запустите Unicycler жирным шрифтом, добавив флаг к команде.
Откройте Bandage и нажмите на файл, затем выберите график загрузки и выберите сборку. файл gfa, который ранее был сохранен на unicycler_output_directory сгенерирован Unicycler. После загрузки файла нажмите кнопку рисования на левой панели инструментов и оцените, завершена ли сборка, изучив, как соединяются и организуются контиги.
Перейдите внутри терминала в папку, в которой хранятся выходные данные Unicycler с помощью команды cd. Затем запустите протокол quast, выполнив команду. Просмотрите отчеты, созданные quast, в выходном каталоге quast_output_directory.
Перейдите внутри терминала в папку, в которой хранятся выходные данные Unicycler с помощью команды cd, затем запустите prokka, выполнив команду. Просмотрите аннотации, открыв таблицу tsv и загрузив сгенерированный файл gff в программное обеспечение для анализа последовательностей. Визуализируйте и анализируйте аннотации в программном обеспечении.
На репрезентативных гелевых изображениях изображены результаты экстракции геномной ДНК или гДНК. Можно наблюдать успешную экстракцию и разделение интактной гДНК. Также изображена неудачная экстракция, показывающая фрагментированное загрязнение гДНК и РНК.
Графики сборки генома бактерий были сгенерированы гибридной сборкой Unicycler de novo и визуализированы Bandage. Полный геном Klebsiella oxytoca KoPF10 продемонстрировал одну закрытую хромосому, а полный геном Klebsiella pneumoniae KpPF25 состоял из закрытой хромосомы и пяти закрытых плазмид. Неполная хромосома Klebsiella pneumoniae KpPF46 состояла из двух взаимосвязанных контигов.
Карты сборки, сгенерированные Geneious Prime для полного генома Klebsiella oxytoca KoPF10 и Klebsiella pneumoniae KpPF25, показывающие аннотированные гены, обозначаемые цветными стрелками вдоль плазмидных магистралей. Чтобы обеспечить успешную загрузку ячейки потока, отфильтруйте длинные считывания, используя рекомендуемые настройки, и убедитесь, что все файлы находятся в fastq. формат gz.
Выполните правильную команду Unicycler, используя файлы, принадлежащие одному образцу.