Method Article
Объединенные секвенирования ДНК является быстрым и экономически эффективной стратегией для обнаружения редких вариантов, связанные с комплексными фенотипов в больших группах. Здесь мы опишем вычислительный анализ объединенных следующего поколения, последовательность из 32 связанных с раком генов с помощью пакета SPLINTER программного обеспечения. Этот метод является масштабируемым, и применимы к любой фенотип интерес.
As DNA sequencing technology has markedly advanced in recent years2, it has become increasingly evident that the amount of genetic variation between any two individuals is greater than previously thought3. In contrast, array-based genotyping has failed to identify a significant contribution of common sequence variants to the phenotypic variability of common disease4,5. Taken together, these observations have led to the evolution of the Common Disease / Rare Variant hypothesis suggesting that the majority of the "missing heritability" in common and complex phenotypes is instead due to an individual's personal profile of rare or private DNA variants6-8. However, characterizing how rare variation impacts complex phenotypes requires the analysis of many affected individuals at many genomic loci, and is ideally compared to a similar survey in an unaffected cohort. Despite the sequencing power offered by today's platforms, a population-based survey of many genomic loci and the subsequent computational analysis required remains prohibitive for many investigators.
To address this need, we have developed a pooled sequencing approach1,9 and a novel software package1 for highly accurate rare variant detection from the resulting data. The ability to pool genomes from entire populations of affected individuals and survey the degree of genetic variation at multiple targeted regions in a single sequencing library provides excellent cost and time savings to traditional single-sample sequencing methodology. With a mean sequencing coverage per allele of 25-fold, our custom algorithm, SPLINTER, uses an internal variant calling control strategy to call insertions, deletions and substitutions up to four base pairs in length with high sensitivity and specificity from pools of up to 1 mutant allele in 500 individuals. Here we describe the method for preparing the pooled sequencing library followed by step-by-step instructions on how to use the SPLINTER package for pooled sequencing analysis (http://www.ibridgenetwork.org/wustl/splinter). We show a comparison between pooled sequencing of 947 individuals, all of whom also underwent genome-wide array, at over 20kb of sequencing per person. Concordance between genotyping of tagged and novel variants called in the pooled sample were excellent. This method can be easily scaled up to any number of genomic loci and any number of individuals. By incorporating the internal positive and negative amplicon controls at ratios that mimic the population under study, the algorithm can be calibrated for optimal performance. This strategy can also be modified for use with hybridization capture or individual-specific barcodes and can be applied to the sequencing of naturally heterogeneous samples, such as tumor DNA.
Этот метод был использован в исследованиях сообщается в Vallania FML и соавт. Genome Research 2010 года.
1. Пример пула и ПЦР захват целевых геномных локусов
2. Объединенные ПЦР подготовка библиотеки и секвенирования
3. Последовательность чтения выравнивания и анализа
4. Редкий вариант обнаружения Использование SPLINTER
5. Представитель Результаты
Мы объединенных населением 947 лиц и целевых более 20 Кб для секвенирования. Мы обратились SPLINTER для обнаружения редких вариантов после нашего стандартного протокола. Каждый человек был ранее генотипирования исполнении генома генотипирования массива. Соответствие между генотипирования меченых и новые варианты называются в совокупной выборки были превосходны (рис. 6). Три варианта, два из которых (rs3822343 и rs3776110) были редки среди населения, были названы заново из последовательности и результаты были подтверждены отдельным пиросеквенирования. Малая частот аллелей (МАФ) в бассейне были похожи на MAF сообщили в dbSNP сборка 129. Согласование между MAF пиросеквенирования и объединенных последовательность была отличная (табл. 3).
Таблица 1. ДНК олигонуклеотидных последовательностей для положительного контроля. Каждая последовательность состоит из фрагмента ДНК, отличающихся от дикого типа ссылки либо две замены или одной вставки и одним удалением. Нажмите здесь, чтобы увеличить изображение .
Таблица 2. Пример SPLINTER выход. Первые две строки представляют собой стандартный вывод SPLINTER для замены или удаления (синий заголовок). Последняя строка представляет стандартный вывод SPLINTER для вставки (фиолетовый заголовок).rget = "_blank"> Нажмите здесь, чтобы посмотреть увеличенное изображение.
Таблица 3. Пять известных и три варианта романа были определены с большой численностью населения и утверждены отдельные генотипирования. Индивидуальная проверка была выполнена пиросеквенирования (строки 1-3), TaqMan анализ (4-6 строк) или Sanger последовательности (строки 7,8). Для широкого диапазона частот аллелей и в том числе пять позиций MAF <1%, соответствие между объединения последовательности аллели оценки частоты и индивидуальных генотипирования было сильным. Позиции, отмеченные звездочкой (*), адаптированных с ранее данными 9.
Рисунок 1. Объединенные ДНК-последовательности и обзор SPLINTER анализа. Пациент ДНК объединенныхи усиление на отдельных локусов. Конечными продуктами ПЦР объединяются вместе с положительными и отрицательными контроля в эквимолярных соотношениях. Объединенные смесь затем последовательно и в результате чтения переходят обратно в ссылку. Сопоставленные отрицательного контроля чтения используются для генерации выполнения конкретной ошибки модели. SPLINTER может быть использован для обнаружения редких ОНП и индели путем включения информации из модели ошибок и положительного контроля. [Адаптировано из Vallania FLM и др., Genome Research, 2010] Нажмите здесь, чтобы увеличить изображение .
Рисунок 2. Объединенные ПЦР перевязки ампликона и ультразвуком. В качестве демонстрации перевязки и случайных шагов фрагментации в протокол подготовки библиотеки, pUC19 вектор ферментативно расщепляется на фрагменты показано в переулок, 2. Эти фрагменты были нормативнойных учебных от числа молекул в сочетании и случайно лигировали в соответствии с этапом 1,7 выше. В результате большой concatamers приведены в полосе 3. Лигированных concatamers было поровну и подвергались обработке ультразвуком, как описано в пункте 1.8 выше. В результате мазка фрагментов ДНК для каждого технического репликации приведены в полосы 4 и 5. Кронштейн подчеркивает размер диапазона, используемого для извлечения геля и создание последовательности библиотеки.
Рисунок 3. Точность в зависимости от покрытия для одного аллеля в совокупной выборки. Точность оценивается как площадь под кривой (AUC) кривой приемник оператора (ROC), которая колеблется от 0,5 (случайных) до 1,0 (совершенно точно). AUC строится в зависимости от покрытия на аллель для обнаружения отдельных мутантных аллелей в бассейнах 200, 500 и 1000 аллели (A). AUC строится как функция общего покрытия для замены, вставки и гeletions (B). [Адаптировано из Vallania FLM и др., Genome Research, 2010].
Рисунок 4. Ошибка график показывает вероятность включения ошибочным базы в данной позиции. Ошибка профиля показывает низкий процент ошибок с ростом тенденции к концу 3 'последовательность чтения. Примечательно, что различные нуклеотиды ссылкой отображать различные вероятности ошибки (см., например, вероятность включения данного C G в качестве ссылки). [Адаптировано из Vallania FLM и др., Genome Research, 2010].
Рисунок 5. Точность заноза в оценке частоты аллелей на должности, которые были больше, чем в 25 раз покрытие на аллеля. По результатам панели, на рисунке 3 показывает оптимальную чувствительность для обнаружения одного варианта с ≥ 25 раз покрытия,Сравнение объединения ДНК частот аллелей оценкам SPLINTER с аллель рассчитывает измеряется GWAS приводит к очень высокой корреляции (г = 0,999). [Адаптировано из Vallania FLM и др., Genome Research, 2010].
Рисунок 6. Сравнение частот аллелей измеряется GWAS по сравнению с SPLINTER оценкам объединения последовательности из 974 лиц. Существовали 19 общих позиций между генотипирование локусов и последовательность областей для сравнения. В результате корреляция очень высока (р = 0,99538). Нажмите здесь, чтобы увеличить рисунок .
Существует все больше доказательств, что заболеваемость и терапевтический эффект общих, сложных фенотипов и таких заболеваний, как ожирение 8, гиперхолестеринемия 4, 7 и гипертония другие могут быть ведущим личные профили редкие вариации. Идентификация генов и путей, где эти варианты в совокупности пострадавшего населения будет иметь глубокие диагностические и терапевтические последствия, но анализ пострадавших лиц по отдельности может занять много времени и стоить непомерно высокими. Население на основе анализа предлагает более эффективный метод для съемки генетической изменчивости в нескольких локусов.
Мы представляем новый объединенный ДНК-последовательности в паре с протоколом пакет SPLINTER программное обеспечение, предназначенное для идентификации такого рода генетические различия между популяциями. Покажем точность этого метода в выявлении и количественной незначительных аллелей в больших объединенных населения 947 человек, включая редкие варианты, которые былиназывается заново из пула последовательности и проверки отдельных пиросеквенирования. Наша стратегия главным образом отличается от других протоколов, включение положительного и отрицательного контроля в каждом эксперименте. Это позволяет SPLINTER добиться гораздо более высокую точность и мощность по сравнению с другими подходами 1. Оптимальное освещение в 25 раз за аллель устанавливается независимо от размера бассейна, что делает анализ больших бассейнов возможно, так как это требование только растет линейно с бассейном размером. Наш подход является очень гибкой и может быть применен к любой фенотип интерес, но и образцы, которые естественным образом гетерогенным, такие как смешанные популяции клеток опухоли и биопсии. С учетом все возрастающего интереса к объединенные последовательности из крупных целевых регионах, таких как ExoME или генома, наш приготовительный библиотеки и SPLINTER анализ совместимый с пользовательскими захвата и целого ExoME последовательности, но выравнивание утилита осколок пакет не предназначен для большойссылки последовательности. Таким образом, мы успешно используется динамический выравниватель программирования, Novoalign для генома выравнивания следует вариант вызова от совокупной выборки (Рамоса и соавт., Который был представлен). Таким образом, наши объединенные последовательности стратегии можно масштабировать успешно большие бассейны с увеличением количества целевой последовательности.
Нет конфликта интересов объявлены.
Эта работа выполнена при финансовой поддержке Детского Открытие института грант MC-II-2006-1 (RDM и TED), NIH Эпигенетика Дорожная карта Грант [1R01DA025744-01 и 3R01DA025744-02S1] (RDM и FLMV), U01AG023746 (SC), Saigh Foundation (FLMV и TED), 1K08CA140720-01A1 и лимонад Алекса Стенд "" Премии поддержки (TED). Мы благодарим доступа генома технический центр кафедры генетики в Вашингтоне школы медицины университета за помощь в геномного анализа. Центр при частичной поддержке NCI онкологический центр поддержки грант № P30 CA91842 в онкологический центр Siteman и ИКТ / CTSA грант № UL1RR024992 от NationalCenter по исследованию ресурсов (NCRR), составной частью Национальных Институтов Здоровья (NIH), и НИЗ для медицинских исследований. Данная публикация является исключительной прерогативой авторов и не обязательно отражает официальную точку зрения NCRR или NIH.
Name | Company | Catalog Number | Comments |
Реагент Имя | Компания | Номер по каталогу | Раздел |
PfuUltra High-Fidelity | Agilent | 600384 | 1,4 |
Бетаин | SIGMA | B2629 | 1,4 |
M13mp18 оцДНК вектор | NEB | N4040S | 1,5 |
pGEM-T Easy | Promega | A1360 | 1,5 |
Т4 полинуклеотидных | NEB | M0201S | 2,2 |
Лигазы Т4 | NEB | M0202S | 2,2 |
Полиэтиленгликоль 8000 МВт | SIGMA | P5413 | 2,2 |
Bioruptor sonicator | Diagenode | UCD-200-TS | 2,3 |
Запросить разрешение на использование текста или рисунков этого JoVE статьи
Запросить разрешениеThis article has been published
Video Coming Soon
Авторские права © 2025 MyJoVE Corporation. Все права защищены