Method Article
Лонг чтения последовательности значительно облегчить Ассамблее сложные геномы и характеристика структурных изменения. Мы описываем метод для создания ультра-длинные последовательности на основе Нанопор виртуализации платформ. Этот подход принимает оптимизированный экстракции ДНК, а затем изменение библиотеки препаратов для создания сотен kilobase читает с умеренной покрытие из клеток человека.
Третьего поколения, что сингл молекула ДНК последовательности технологии предлагают значительно больше читать длина, которая может содействовать Ассамблея сложных геномов и анализ сложных структурных вариантов. Нанопор платформах выполняют одной молекулы последовательности непосредственно измеряя текущие изменения, при посредничестве ДНК проход через поры и может генерировать сотни читает kilobase (КБ) с минимальными затратами капитала. Эта платформа была принята многими исследователями для различных приложений. Достижения длины последовательности чтения является наиболее важным фактором использовать значение Нанопор виртуализации платформ. Для создания ультра-длинный читает, особое внимание требуется избежать поломки ДНК и повышение эффективности для создания производственной последовательности шаблоны. Здесь мы предоставляем подробный протокол долговечный секвенирования ДНК, включая экстракции ДНК высокой молекулярной массой (HMW) из свежих или замороженных клеток, Библиотека строительство механической резки или Транспозаза фрагментации и виртуализации на устройстве Нанопор. От 20-25 мкг HMW ДНК метод можно добиться N50, читать длиной 50-70 КБ с механической резки и N50 90-100 КБ читать длина с Транспозаза при посредничестве фрагментации. Протокол может применяться к ДНК, извлеченные из клеток млекопитающих для выполнения всего генома для выявления структурных вариантов и геном Ассамблеи. Дополнительные усовершенствования на экстракции ДНК и ферментативных реакций будет далее увеличить длину чтения и расширять его полезности.
За последнее десятилетие массивно параллельной и высокоточные второго поколения высокопроизводительного секвенирования технологии заставили взрыв биомедицинских открытий и технологических инноваций в1,2,3. Несмотря на технический прогресс короткие чтение данных, генерируемых второго поколения платформы являются неэффективными в урегулировании сложных регионах геномной и ограничены в обнаружении геномной структурных вариантов (СВС), которые играют важную роль в человека Эволюция и болезней4,5. Кроме того короткий чтение данных не удается разрешить повторные изменения и непригодны для взыскательных гаплотип поэтапного генетических вариантов6.
Недавний прогресс в одной молекулы последовательности предлагает значительно больше читать длина, которая может облегчить обнаружение полный спектр СВС7,8,9, и предлагает точные и полные собрания комплекса микробов и млекопитающих геномов6,10. Нанопор платформа выполняет секвенирование одной молекулы, непосредственно измерения текущих изменений при посредничестве ДНК прохода через поры11,12,13. В отличие от любых существующих химия секвенирования ДНК, Нанопор последовательности может генерировать Лонг (десятки тысяч kilobases) читает в режиме реального времени, не полагаясь на кинетику полимеразы или искусственные амплификации ДНК образца. Таким образом Нанопор Лонг чтения последовательности (РНБ seq) имеет большие перспективы для создания ультра-чтения длинных далеко за 100 КБ, что значительно ускорит геномных и биомедицинских анализов14, особенно в низкой сложности или повторить богатые регионы в геномах15.
Уникальная особенность Нанопор последовательности является его способность генерировать длинный читает без ограничения теоретическая длина. Таким образом чтение длина зависит от физической длина ДНК, которая напрямую зависит от качества шаблон целостности и последовательности ДНК. Кроме того в зависимости от степени манипуляции и количество шагов, например дозирования сил и условий извлечения, качество ДНК является крайне непостоянны. Таким образом это является сложной задачей для одного, чтобы принести долго читает, просто применив стандартные протоколы извлечения дна и производителя предоставленного библиотеки строительных методов. С этой целью мы разработали надежный метод для создания ультра-долгий читать (сотни kilobases) последовательности данных, начиная от заготовленных клеток окатышей. Мы приняли несколько улучшений в процедуре подготовки ДНК добычи и библиотека. Мы рационализированы протокол для исключения ненужных процедур, которые вызывают деградации ДНК и убытки. Этот протокол состоит из высокой молекулярной массой (HMW) экстракции ДНК, ультра-длинный строительство библиотеки ДНК и последовательности на платформе Нанопор. Для хорошо подготовленных молекулярный биолог обычно занимает 6 h от заготовки до завершения извлечения HMW ДНК, 90 мин или 8 h для строительства библиотеки в зависимости от метода сдвига и еще 48 h для секвенирования ДНК клетки. Использование протокола позволит геномики сообщество для улучшения нашего понимания сложности генома и получить новое понимание изменения генома в заболеваниях человека.
Примечание: РНБ seq протокол состоит из трех последовательных этапов: 1) добыча высокомолекулярный вес геномной ДНК (HMW); 2) ультра-долгий строительство библиотеки ДНК, которая включает в себя фрагментация ДНК HMW в желаемых размеров и перевязка адаптеров секвенирования ДНК заканчивается; и 3) Загрузка лигируют адаптер ДНК на массивы Нанопоры (рис. 1).
1. HMW ДНК добыча
2. долговечный строительство библиотеки ДНК
Примечание: Существует два способа для создания ультра-долгий библиотеки ДНК, на основе двух различных методов режа, в сочетании с Нанопор последовательности комплекты. Механический стрижки на основе библиотеки производит данные с N50 50-70 КБ, принимая около 8 ч на строительство библиотеки. Транспозаза библиотека на основе фрагментации производит N50 90-100 КБ данных, принимая только 90 мин на строительство библиотеки. Механических ножниц протокол дает высокую доходность от же ДНК, вход с использованием одинаковых версий адаптер последовательности и качества Нанопор потока клеток.
3. последовательность на устройстве Нанопор
Ультра-длинный протокол секвенирования ДНК применяется HMW ДНК на строительство библиотеки. Таким образом, важно выбрать хорошо культивируемых клеток с живой соотношение > 85% в ячейку шаг для сбора урожая. Количество ячеек, которые используются для извлечения ДНК будет влиять на качество и количество HMW ДНК. Лизис клеток не хорошо работать, если начиная с слишком много клеток. Использование слишком мало клеток не создает достаточно ДНК на строительство библиотеки потому что осадков HMW ДНК выполняется с использованием мягкое вращение вручную вместо высокоскоростной центрифуги. Пример HMW ДНК после добавления ледяной 100% этанола и вращения отображается как Белый преципитат хлопок как на рисунке 2.
Важно проверить качество ввода ДНК до начала строительства библиотеки. Деградации, неправильный количественной оценки, загрязнения (например, белки, РНК, моющие средства, ПАВ и остаточные фенол или этанола) и низкомолекулярных ДНК может иметь значительное влияние на последующих процедур и на финале читать длины. Рекомендуется выполнять с помощью ДНК из трех различных мест в пробирку, содержащую HMW ДНК анализ КК. От УФ чтение результатов для HMW ДНК ОД260/OD280 значение приблизительно 1.9 и ОД260/OD230 значение приблизительно 2.3 (Рисунок 3АB). Эти значения коэффициента согласуются среди трех тестов для хорошей HMW ДНК образца. Различные методы стрижка требует различных объемов ввода ДНК. Концентрация ДНК HMW должна быть > 200 нг/мкл для механической резки в то время как она должна быть > 1 мкг/мкл Транспозаза фрагментации. Концентрация определяется флуориметр немного ниже, чем УФ чтения. Однако коэффициент вариации концентрации же HMW ДНК образца должен быть менее 15% с флуориметр и УФ, чтение анализов. Механической резки применяется шприц с иглой сломать HMW ДНК, так что количество проходов через иглу будет влиять размер стриженый ДНК и финал читать длины. Рекомендуется выполнять размер КК, после того, как иглы, Ножницы механические для обеспечения большинства HMW ДНК больше чем 50 КБ, как показано на рисунке 4. В методе механических ножниц 30 проходит созданы наилучшие результаты секвенирования, учитывая длину и вывода.
N50 механических стрижки на основе библиотеки составляет 50-70 КБ Транспозаза библиотека на основе фрагментации при 90-100 КБ. Результаты четырех трасс с использованием линии клетки HG00733 приведены в таблице 1. Все четыре трассы имеют более 2300 читает с длиной более 100 КБ. Максимальная длина больше в Транспозаза на основе фрагментации библиотек (455 kb и 489 kb) по сравнению с механическим библиотеки на основе сдвига (348 КБ и 387 kb) хотя последний больше всего читает, указав более высокую доходность. Строительство на основе фрагментации библиотека Транспозаза имеет меньше шагов и короче время приготовления так, что он представит меньше короткие фрагменты. Две трассы, с помощью Транспозаза имеют больше средней длины (> 30 КБ) и средней длины (> 10 КБ). Кроме того данные показывает высокого качества в всех прогонов (показатель среднего качества является приблизительно 10.0, ~ 90% базовая точность). Более 97% всего баз были выровняны к геном человека ссылки (hg19), с помощью Minimap216 с параметрами по умолчанию. Ожидаемый размер распределения сырья гласит показаны на рисунке 5. Все запуски имеют значительную долю данных выше 50 КБ, а Транспозаза на основе фрагментации библиотеки имеют более высокий коэффициент, ультра-длинный гласит (например > 100 kb). Этот протокол был успешно применяется в нескольких линий клеток человека (Дополнительная таблица 1).
Рисунок 1: схема обзор процесса Нанопор Лонг чтения последовательности (РНБ seq). Оранжевый, Транспозаза комплекс. Желто зеленый, Нанопор адаптер. Пожалуйста, нажмите здесь, чтобы посмотреть большую версию этой фигуры.
Рисунок 2: представитель ДНК осадков от метода извлечения фенол хлороформ. Белая стрелка указывает HMW ДНК. Пожалуйста, нажмите здесь, чтобы посмотреть большую версию этой фигуры.
Рисунок 3: пример QC результаты HMW ДНК от УФ чтения. (A) HMW ДНК из шага 1.21.1 готов для строительства механических стрижки на основе библиотеки. (B) HMW ДНК из шага 1.21.2 для строительства на основе фрагментации библиотеки Транспозаза. Пожалуйста, нажмите здесь, чтобы посмотреть большую версию этой фигуры.
Рисунок 4: QC результаты иглы стриженый HMW ДНК электрофорезом геля импульсного поля. L1: Быстрый нагрузки 1 kb ДНК лестница; L2: Быстрый нагрузки 1 КБ продлить лестница ДНК. 1-8: ДНК с различными проходящей раз через иглу стрижки. 1-3, не резки; 4, 10 раз; 5, 20 раз; 6, 30 раз; 7, 40 раз; 8, 50 раз. Этот шаг КК является необязательным. Пожалуйста, нажмите здесь, чтобы посмотреть большую версию этой фигуры.
Рисунок 5: ожидаемый размер распределения библиотек долговечный ДНК Нанопор. MS, механические библиотеки на основе сдвига. TF, Транспозаза на основе фрагментации библиотек. Пожалуйста, нажмите здесь, чтобы посмотреть большую версию этой фигуры.
Механические shearing_rep1 | Механические shearing_rep2 | Транспозаза fragmentation_rep1 | Транспозаза fragmentation_rep2 | |
Клеточная линия | HG00733 | HG00733 | HG00733 | HG00733 |
N50 гласит: | 55,180 | 63,007 | 98,237 | 95,629 |
Количество операций чтения больше чем 100 КБ | 2500 | 3,082 | 2,386 | 2355 |
Количество всего читает | 97,859 | 80,465 | 24,166 | 21,032 |
Максимальная длина (bp) | 348,482 | 387,113 | 454,660 | 489,426 |
Средняя длина (bp) | 17.861 | 20,395 | 33,528 | 38,175 |
Средней длины (bp) | 5,335 | 5,894 | 10,249 | 15,656 |
Среднее качество гласит: | 10,0 | 10.1 | 9,9 | 10,0 |
Общая основы сырья чтений | 1,747,849,822 | 1,641,058,932 | 810,229,733 | 802,886,304 |
Общая основы унифицированных чтений | 1,693,300,832 | 1,607,975,925 | 791,422,077 | 778,417,627 |
Сопоставленные соотношение всего баз (hg19, Minimap2) | 96,9% | 98.0% | 97,7% | 97,0% |
Количество активных поры | 1225: 480, 402, 254, 89 | 1058: 480, 356, 176, 46 | 958: 452, 328, 148, 30 | 1092: 487, 367, 195, 43 |
Таблица 1: Резюме от метрики производительности работает с различными протоколами, стрижка.
Библиотека 1 | Библиотека 2 | |
Клеточная линия | K562 | GM19240 |
Ячейка, информация о заказе | ATCC, Кот. LOL CCL-243 | Институт Coriell, Кот. LOL GM19240 |
Протокол | механический стрижка | механический стрижка |
N50 гласит: | 60,063 | 55,295 |
Количество всего читает | 193,783 | 120,807 |
Средней длины (bp) | 1,843 | 4,688 |
Средняя длина (bp) | 9,825 | 17,408 |
Максимальная длина (bp) | 548,780 | 212,338 |
Общая основы сырья чтений | 1,903,989,686 | 2,103,015,331 |
Общая основы унифицированных чтений | 1,837,350,047 | 1,997,419,761 |
Сопоставленные соотношение всего баз (hg19, Minimap2) | 96,6% | 95,0% |
Количество активных поры | 1111: 482, 371, 203, 55 | 1032: 447, 333, 196, 56 |
Дополнительная таблица 1: Резюме двух РНБ seq запусков с помощью других клеточных линий с механических ножниц протоколом.
В принципе секвенирование Нанопор способен генерировать 100 КБ до megabase читает в длину11,12,13. Четыре основных фактора влияют на производительность последовательности выполнения и качества данных: 1) числа активных поры и деятельность поры; 2) мотор белок, который контролирует скорость ДНК, проходя через Нанопор; 3) ДНК шаблон (длина, чистоту, качество, массовые); 4) последовательности адаптер лигирование эффективность, которая определяет полезной ДНК из образца ввода. Первые два фактора зависят от версии потока ячейки и комплект последовательности, представленной изготовителем. Вторая два фактора являются важнейшие шаги в настоящем Протоколе (экстракции ДНК HMW, стрижка и маточных труб).
Этот протокол требует терпения и практики. Для ультра-долгий библиотеки ДНК6важно качество HMW ДНК. Протокол начинается с клетки, собранные с высокой жизнеспособности (> 85% жизнеспособных клеток предпочитали), ограничивая деградации ДНК от мертвых клеток. Следует избегать любых суровых процесс, который может ввести повреждений ДНК (например, сильное беспокойство, пожимая, вихря, несколько дозирования, неоднократные замораживания и оттаивания). В разработке протокола мы опускаем, дозирование в весь процесс экстракции ДНК. Широкое отверстие советы должны быть использованы когда закупорить необходим после механической резки во время строительства библиотеки и последовательности. Как Нанопоры чувствительны к химия в камеру буфера12, должна существовать как несколько остаточных загрязнителей (например, моющие средства, ПАВ, фенол, этанол, белки РНК, и т.д.) как можно скорее в ДНК. Учитывая длину и урожайности метод экстракции фенольных показывает лучшие и наиболее воспроизводимые результаты, по сравнению с несколькими различных извлечения методы испытания пока.
Несмотря на способность производить Лонг чтения последовательности, этот протокол по-прежнему остаются некоторые ограничения. Во-первых этот протокол был оптимизирован на основе Нанопор последовательности устройства, имеющиеся на момент публикации; Таким образом он ограничивается выборочной основе Нанопор последовательности химии и может быть неоптимальной, когда выступал в других типов устройств Лонг чтения последовательности. Во-вторых результат сильно зависит от качества ДНК, извлеченные из исходного материала (ткани или клетки). Чтение длина будет снижена, если начальный ДНК уже деградированных или повреждены. В-третьих хотя несколько КК шаги включены в протокол для проверки качества ДНК, окончательный выход и длина гласит могут быть затронуты в ячейку потока и поры деятельность, которая может быть переменной на этой ранней стадии Нанопор виртуализации платформы развития.
Протокол, в описанный здесь использует образцы линии клетки человека подвеска для экстракции ДНК. Мы оптимизировали проходящей раз в иглу, стрижка, соотношение HMW ДНК Транспозаза и перевязка времени для получения результатов, описанных. Протокол может быть расширен четырьмя способами. Во-первых пользователи могут начать с других культивируемых клеток млекопитающих и различное количество клеток, тканей, клинические образцы или других организмов. Потребуется дальнейшая оптимизация на время инкубации лизиса, том реакции и центрифугирования. Во-вторых это трудно предсказать размер целевого для ультра-долгий чтения последовательности. Если чтение длина короче, чем ожидалось, пользователи могут настроить проходящей раз в механический метод, основанный на стрижки или изменить отношение HMW ДНК в Транспозаза в методе Транспозаза на основе фрагментации. Длиннее время привязки и элюции во время очистки шаги полезны, потому что HMW ДНК вязкие. В-третьих с различными Нанопор последовательности устройств, один можно настроить количество и объем ДНК, чтобы соответствовать критериям программы sequencer. В-четвертых будет виртуализированных только ДНК, лигируют последовательности адаптерам. Для дальнейшего повышения эффективности перевязки, одно может попытаться Титруйте адаптер и лигаза концентрации. Изменение лигирование время и молекулярных скоплению агентов, таких как PEG18 может применяться в будущем. Ультра-длинный протокол секвенирования ДНК в сочетании с ТРИФОСФАТЫ19,20 может предложить эффективный инструмент для обогащения последовательности целевого объекта.
Авторы заявляют, что они не имеют никаких финансовых интересов.
Авторы благодарят Y. Чжу за ее замечания по рукописи. Исследования, сообщили в настоящем издании частично поддерживается национального института рака национальных институтов здоровья под награду номер P30CA034196. Содержание является исключительно ответственности авторов и не обязательно отражают официальную точку зрения национальных институтов здоровья.
Name | Company | Catalog Number | Comments |
Reagents | |||
Absolute ethanol | Sigma-Aldrich | E7023 | |
Agencourt AMPure XPbeads | Beckman | A63881 | magnetic beads for cleanup |
BD conventional needles | Becton Dickinson | 305136 | 27G, for mechanical shearing |
BD Luer-Lok syringe | Becton Dickinson | 309628 | for mechanical shearing |
Blunt/TA Ligase Master Mix | NEB | M0367S | |
Countess Cell Counting Chamber Slides | Invitrogen | C10228 | for cell counting |
EDTA | Invitrogen | AM9261 | pH 8.0, 0.5 M, 500 mL |
Flow Cell | Oxford Nanopore Technologies | FLO-MIN106 | R9.4.1 |
HG00773 cells | Coriell Institute | HG00733 | cells used in this protocol |
Ligation Sequencing Kit 1D | Oxford Nanopore Technologies | SQK-LSK108 | nanopore ligation kit |
MaXtract High Density tubes | Qiagen | 129073 | gel tubes |
NEBNext FFPE DNA Repair Mix | NEB | M6630S | |
NEBNext Ultra II End Repair/dA-Tailing Module | NEB | M7546S | |
Nuclease-free water | Invitrogen | AM9937 | |
Phosphate-Buffered Saline, PBS | Gibco | 70011044 | 10X, pH 7.4 |
Phenol:chloroform:IAA | Invitrogen | AM9730 | |
Proteinase K | Qiagen | 19131 | 20 mg/mL |
Qubit dsDNA BR Assay Kit | Invitrogen | Q32850 | fluorometer assays for DNA quantification |
Rapid Sequencing Kit | Oxford Nanopore Technologies | SQK-RAD004 | nanopore transposase kit |
RNase A | Qiagen | 19101 | 100 mg/mL |
SDS | Invitrogen | AM9822 | 10% (wt/vol) |
Sodium chloride solution | Invitrogen | AM9759 | 5.0 M |
TE buffer | Invitrogen | AM9849 | pH 8.0 |
Tris | Invitrogen | AM9856 | pH 8.0, 1 M |
Triton X-100 solution | Sigma-Aldrich | 93443 | ~10% |
Name | Company | Catalog Number | Comments |
Equipment | |||
Bio-Rad C1000 Thermal Cycler | Bio-Rad | 1851196EDU | |
Centrifuge 5810R | Eppendorf | 22628180 | |
Countess II FL Automated Cell Counter | Life Technologies | AMQAF1000 | for cell counting |
DynaMag-2 Magnet | Life Technologies | 12321D | magnetic rack |
Eppendorf ThermoMixer | Eppendorf | 5382000023 | for incubation |
Freezer | LabRepCo | LHP-5-UFMB | |
GridION | Oxford Nanopore Technologies | GridION X5 | nanopore device used in this protocol |
HulaMixer Sample Mixer | Thermo Fisher Scientific | 15920D | rotator mixer |
MicroCentrifuge | Benchmark Scientific | C1012 | |
NanoDrop ND-1000 Spectrophotometer | Thermo Fisher Scientific | ND-1000 | for UV reading |
Pippin Pulse | Sage Science | PPI0200 | pulsed-field gel electrophoresis instrument |
Qubit 3.0 Fluorometer | Invitrogen | Q33216 | fluorometer |
Refrigerator | LabRepCo | LABHP-5-URBSS | |
Vortex-Genie 2 | Scientific Industries | SI-A236 | |
Water bath | VWR | 89501-464 |
Запросить разрешение на использование текста или рисунков этого JoVE статьи
Запросить разрешениеThis article has been published
Video Coming Soon
Авторские права © 2025 MyJoVE Corporation. Все права защищены