Long-leitura sequências facilitam grandemente a montagem de genomas complexas e caracterização da variação estrutural. Nós descrevemos um método para gerar as sequências ultra-longa pelas plataformas de sequenciamento baseado em nanopore. A abordagem adota uma extração de DNA otimizada seguida de preparações de biblioteca modificada para gerar centenas de mil leituras com cobertura moderada de células humanas.
Terceira geração de tecnologias de sequenciamento de DNA único-molécula oferecem significativamente mais ler comprimento que pode facilitar a montagem de genomas complexas e análise das variantes estruturais complexas. Nanopore plataformas executam sequenciamento de único-molécula medindo diretamente as alterações atuais mediadas pela passagem de DNA através dos poros e podem gerar centenas de leituras de quilobase (kb) com custo de capital mínimo. Esta plataforma tem sido adotada por muitos pesquisadores para uma variedade de aplicações. Alcançar longas distâncias de leitura de sequenciamento é o fator mais crítico para alavancar o valor das plataformas de sequenciamento de nanopore. Para gerar leituras ultra-longa, consideração especial é necessário para evitar quebras de DNA e ganhar eficiência para gerar modelos de sequenciamento produtivo. Aqui, nós fornecemos o protocolo detalhado de ultra-longa sequenciamento de DNA, incluindo a extração de DNA de alto peso molecular (HMW) de células frescas ou congeladas, construção de biblioteca por mecânica de corte ou fragmentação de transposase e sequenciamento em um dispositivo de nanopore. De 20 a 25 µ g de DNA HMW, o método pode atingir N50 ler comprimento de 50-70 kb com corte mecânico e N50 de 90-100 kb ler comprimento com transposase mediada por fragmentação. O protocolo pode ser aplicado a DNA extraído de células de mamíferos, para realizar o sequenciamento do genoma inteiro para a detecção de variantes estruturais e montagem do genoma. As melhorias adicionais na extração de DNA e reações enzimáticas mais aumentará o comprimento Leia e expandir sua utilidade.
Na última década, maciçamente paralelo e tecnologias de segunda geração altamente precisos da elevado-produção sequenciamento conduziram a uma explosão da inovação tecnológica1,2,3e descoberta de biomédica. Apesar dos progressos técnicos, os curto-ler dados gerados pelas plataformas da segunda geração são ineficazes para resolver complexas regiões genômicas e são limitados na detecção de variantes estruturais genômicas (SVs), que desempenham papéis importantes em humanos evolução e doenças4,5. Além disso, curto-ler dados são incapazes de resolver a variação de repetição e são impróprios para discernir haplótipo eliminação de variantes genéticas6.
Recentes progressos em único-molécula sequenciamento oferece significativamente mais ler o comprimento, o que pode facilitar a detecção de todo o espectro da SVs7,8,9e ofertas exactas e completas de montagem do complexo microbiana e mamíferos genomas6,10. A plataforma nanopore executa single-molécula sequenciamento medindo diretamente as alterações atuais mediadas pela passagem de DNA através dos poros11,12,13. Ao contrário de qualquer existente química de sequenciamento de DNA, sequenciamento de nanopore pode gerar long (dezenas de milhares de kilobases) leituras em tempo real, sem depender de cinética de polimerase ou artificial amplificação da amostra do DNA. Portanto, nanopore longa leitura sequenciamento (NLR-seq) detém grande promessa para gerar ultra-longa comprimentos Leia bem além de 100kb, que avançou grandemente análises genômicas e biomédica14, particularmente na baixa complexidade ou repetição-rico regiões dos genomas15.
A característica única de sequenciamento de nanopore é seu potencial para gerar longo lê sem uma limitação do comprimento teórico. Portanto, o comprimento de leitura é dependente do comprimento físico do DNA que é diretamente afetado pela qualidade de modelo de integridade e sequenciamento do DNA. Além disso, dependendo da extensão da manipulação e o número de etapas envolvidas, tais como forças de pipetagem e condições de extração, a qualidade do DNA é altamente variável. Portanto, é desafiador para um ceder tempo leituras aplicando apenas os protocolos padrão de extração de DNA e métodos de construção de biblioteca fornecido do fabricante. Para este fim, nós desenvolvemos um robusto método para gerar ultra-longa ler (centenas de kilobases) dados de sequenciamento a partir de células colhidos Pelotas. Adotamos várias melhorias nos procedimentos de preparação de extração e biblioteca de DNA. Racionalizámos o protocolo para excluir procedimentos desnecessários que causam danos e degradação do DNA. Este protocolo é composto de alto peso molecular (HMW) extração de DNA, construção de biblioteca de DNA ultra-longa e sequenciamento em uma plataforma de nanopore. Para um biólogo molecular bem treinado, que normalmente demora 6h da célula da colheita para a realização de extração de DNA de HMW, 90 min ou 8 h para construção de biblioteca, dependendo do método de corte e até um mais 48 h para sequenciamento de DNA. O uso do protocolo irá capacitar a Comunidade genômica para melhorar a nossa compreensão da complexidade do genoma e ganhar a introspecção nova variação do genoma em doenças humanas.
Nota: O protocolo NLR-seq consiste de três etapas consecutivas: 1) extração de alta-molecular peso DNA genômico (HMW); 2) ultralonga construção de biblioteca de DNA, que inclui a fragmentação do ADN para o tamanho desejado HMW e ligadura dos adaptadores de sequenciamento do DNA termina; e 3) carregamento do DNA adaptador-ligados para as matrizes de nanoporos (Figura 1).
1. extração de DNA HMW
2. ultralonga construção de biblioteca de DNA
Nota: Existem duas maneiras para construir as bibliotecas de DNA ultra-longa com base em dois diferentes métodos de corte juntamente com kits de sequenciamento de nanopore. Uma biblioteca baseada em cisalhamento mecânica produz dados com um N50 de 50-70 kb, levando cerca de 8 h para a construção da biblioteca. Uma biblioteca de fragmentação-based transposase produz um N50 de 90-100 kb de dados, tendo apenas 90 min para a construção da biblioteca. O protocolo de corte mecânico dá maior rendimento de DNA mesmo usando versões idênticas de adaptador de sequenciamento e qualidade de nanopore células de fluxo de entrada.
3. sequenciamento do dispositivo nanopore
O protocolo de sequenciamento de DNA ultra-longa aplica HMW DNA para construção de biblioteca. Portanto, é fundamental escolher pilhas bem cultivadas com relação ao vivo > 85% na célula colheita passo. A quantidade de células usadas para extração de DNA afetará a qualidade e a quantidade de DNA HMW. A lise celular não funciona bem se iniciando com muitas células. Usar poucas células não gera DNA suficiente para construção de biblioteca porque a precipitação do DNA HMW é executada usando a rotação suave à mão em vez de centrifugação de alta velocidade. Um exemplo do DNA HMW depois adicionando gelada 100% de etanol e de giro é mostrado como o precipitado branco de algodão-como na Figura 2.
É importante verificar a qualidade da entrada DNA antes de iniciar a construção da biblioteca. Degradação, quantificação incorreta, contaminação (por exemplo, proteínas, RNAs, detergentes, surfactante e fenol residual ou etanol) e baixo peso molecular de ADN podem ter um efeito significativo sobre os procedimentos subsequentes e leia o comprimento final. Recomendamos realizar a análise QC usando o DNA de três locais diferentes no tubo contendo DNA HMW. De UV, lendo os resultados para o DNA HMW, o valor de280 OD260/OD é aproximadamente 1.9 e o valor de230 OD260/OD é aproximadamente 2.3 (Figura 3AB). Estes valores de proporção são consistentes entre os três ensaios para uma boa amostra de DNA HMW. Diferentes métodos de corte exige diferentes volumes de entrada DNA. A concentração de DNA HMW precisa ser > 200 ng / µ l para a tosquia mecânica enquanto ele precisa ser > 1 µ g / µ l para fragmentação transposase. A concentração detectada por um dados é um pouco menor do que a UV lendo. No entanto, o coeficiente de variação da concentração da amostra de DNA HMW do mesma é necessário para ser menos de 15% com ambos os dados e o UV ensaios de leitura. Cisalhamento mecânico aplica-se uma seringa com uma agulha para quebrar o HMW DNA para que o número de passes através da agulha terá impacto sobre o tamanho do DNA cortado e o final leia o comprimento. É aconselhável executar tamanho QC depois agulha de corte para garantir a maioria do DNA HMW é maior do que 50 kb, conforme ilustrado na Figura 4. No método de corte mecânico, 30 passes gerou os melhores resultados de sequenciamento, considerando o comprimento e a saída.
O N50 de uma biblioteca baseada no corte mecânica é 50-70 kb, enquanto uma biblioteca baseada na fragmentação de transposase é 90-100 kb. Os resultados de quatro corridas, usando a linha de celular HG00733 são mostrados na tabela 1. Todas as quatro corridas tem mais de 2.300 leituras com comprimento maior que 100 kb. O comprimento máximo é mais longo nas transposase baseado na fragmentação bibliotecas (455 kb e 489 kb) em comparação com as bibliotecas baseadas em corte mecânicas (348 kb e 387 kb) enquanto o último produzido mais leituras totais, indicando um rendimento mais elevado. A construção da biblioteca baseada em fragmentação transposase tem menos etapas e menor tempo de preparação para que introduzirá menos fragmentos curtos. As execuções de dois usando transposase têm um comprimento mais longo (> 30 kb) e comprimento médio (> 10 kb). Além disso, os dados mostram consistente alta qualidade em todas as execuções (índice de qualidade média é aproximadamente 10.0, ~ 90% base de precisão). Mais de 97% das bases totais foram alinhados para o genoma humano de referência (hg19) usando Minimap216 com as configurações padrão. As distribuições de tamanho esperado do cru diz são mostradas na Figura 5. Todas as execuções têm uma grande proporção de dados acima de 50 kb, enquanto transposase baseado na fragmentação bibliotecas têm uma maior taxa de leituras ultra longas (por exemplo, > 100 kb). Este protocolo tem sido aplicado com sucesso em várias linhas de células humanas (complementar a tabela 1).
Figura 1: visão geral esquemática de fluxo de trabalho longa leitura sequenciamento (NLR-seq) nanopore. Laranja, o transposase complexo. Amarelo-verde, o adaptador nanopore. Clique aqui para ver uma versão maior desta figura.
Figura 2: precipitação do DNA representativa do método de extração do fenol-clorofórmio. A seta branca indica o DNA HMW. Clique aqui para ver uma versão maior desta figura.
Figura 3: resultados de exemplo QC do DNA da leitura UV HMW. (A) HMW DNA da etapa 1.21.1 pronto para construção mecânica biblioteca baseada em corte. (B) HMW DNA da etapa 1.21.2 para construção de biblioteca baseada em fragmentação transposase. Clique aqui para ver uma versão maior desta figura.
Figura 4: resultados QC da agulha cisalhadas HMW DNA por eletroforese em gel de campo pulsado. L1: Quick-load kb 1 escada de DNA; L2: Quick-carga 1KB estender a escada de DNA. 1-8: DNA com tempos diferentes de passagem através da agulha de corte. 1-3, sem distorção; 4, 10 vezes; 5, 20 vezes; 6, 30 vezes; 7, 40 vezes; 8, 50 vezes. Esta etapa QC é opcional. Clique aqui para ver uma versão maior desta figura.
Figura 5: espera-se distribuições de tamanho das bibliotecas de DNA ultra-longa nanopore. MS, bibliotecas baseadas em corte mecânicas. TF, transposase baseado na fragmentação bibliotecas. Clique aqui para ver uma versão maior desta figura.
Mecânica shearing_rep1 | Mecânica shearing_rep2 | Transposase fragmentation_rep1 | Transposase fragmentation_rep2 | |
Linha celular | HG00733 | HG00733 | HG00733 | HG00733 |
N50 das leituras | 55.180 | 63.007 | 98.237 | 95.629 |
Número de leituras mais do que 100 Kb | 2.500 | 3.082 | 2.386 | 2.355 |
Número de leituras totais | 97.859 | 80.465 | 24.166 | 21.032 |
Comprimento máximo (bp) | 348.482 | 387.113 | 454.660 | 489.426 |
Comprimento (bp) | 17.861 | 20.395 | 33.528 | 38.175 |
Comprimento médio (bp) | 5.335 | 5.894 | 10.249 | 15.656 |
Significa qualidade das leituras | 10.0 | 10.1 | 9.9 | 10.0 |
Bases totais de leituras crus | 1,747,849,822 | 1,641,058,932 | 810,229,733 | 802,886,304 |
Bases totais de leituras alinhadas | 1,693,300,832 | 1,607,975,925 | 791,422,077 | 778,417,627 |
Mapeada relação das bases totais (hg19, Minimap2) | 96,9% | 98,0% | 97,7% | 97.0% |
Número de poros ativos | 1225: 480, 402, 254, 89 | 1058: 480, 356, 176, 46 | 958: 452, 328, 148, 30 | 1092: 487, 367, 195, 43 |
Tabela 1: Resumo das métricas de desempenho é executado com protocolos diferentes de corte.
Biblioteca 1 | Biblioteca 2 | |
Linha celular | K562 | GM19240 |
Célula de informação requisitando | ATCC, gato. Não. CCL-243 | Instituto Coriell, gato. Não. GM19240 |
Protocolo | corte mecânico | corte mecânico |
N50 das leituras | 60.063 | 55.295 |
Número de leituras totais | 193.783 | 120.807 |
Comprimento médio (bp) | 1.843 | 4.688 |
Comprimento (bp) | 9.825 | 17.408 |
Comprimento máximo (bp) | 548.780 | 212.338 |
Bases totais de leituras crus | 1,903,989,686 | 2,103,015,331 |
Bases totais de leituras alinhadas | 1,837,350,047 | 1,997,419,761 |
Mapeada relação das bases totais (hg19, Minimap2) | 96,6% | 95.0% |
Número de poros ativos | 1111: 482, 371, 203, 55 | 1032: 447, 333, 196, 56 |
Complementar tabela 1: Resumo das duas corridas NLR-seq usando outras linhas celulares com o protocolo de corte mecânico.
Em princípio, sequenciamento de nanopore é capaz de gerar 100 kb para megabase leituras no comprimento11,12,13. Quatro principais fatores afetarão o desempenho de qualidade de dados e executar o sequenciamento: 1) números ativo dos poros e a atividade dos poros; 2) proteína motor, que controla a velocidade do DNA de passagem da nanopore; 3) modelo DNA (comprimento, pureza, qualidade, massa); 4) sequenciamento adaptador ligadura eficiência, que determina o DNA utilizável do exemplo de entrada. Os dois primeiros fatores dependem da versão da célula de fluxo e o kit de sequenciamento, fornecido pelo fabricante. Os segundo dois fatores são passos críticos no presente protocolo (extração de DNA HMW, cisalhamento e ligadura).
Este protocolo requer paciência e prática. A qualidade do DNA HMW é importante para ultra-longa de bibliotecas de DNA6. O protocolo começa com células coletadas com alta viabilidade (> 85% de células viáveis preferida), limitando o DNA degradado de células mortas. Qualquer processo áspero que pode apresentar danos ao DNA (por exemplo, forte perturbando, tremendo, vórtice, múltiplos pipetagem, repetidos congelamento e descongelamento) deve ser evitado. Na concepção do protocolo, omitimos pipetagem em todo o processo de extração de DNA. Dicas de furo grande precisam ser usado quando pipetagem é necessário após o corte mecânico durante a construção da biblioteca e sequenciamento. Como os nanoporos são sensíveis os produtos químicos na câmara reserva12, deveria haver tão poucos contaminantes residuais (por exemplo, os detergentes, surfactantes, fenol, etanol, proteínas, RNAs, etc) quanto possível no DNA. Considerando o comprimento e o rendimento, o método de extração do fenol mostra os resultados melhores e mais reprodutíveis em comparação com vários métodos de extração diferentes testados até agora.
Apesar da capacidade do presente protocolo para produzir sequências de leitura longa, várias limitações ainda permanecem. Em primeiro lugar, este protocolo foi otimizado com base no dispositivo de sequenciamento de nanopore disponível no momento da publicação; assim, é limitado para a química seletiva de sequenciamento baseado em nanopore e pode ser de qualidade inferior quando executadas em outros tipos de dispositivos de sequenciamento de long-leitura. Em segundo lugar, o resultado é altamente dependente da qualidade do DNA extraído de matérias-primas (tecidos ou células). Comprimento de leitura pode ser comprometido se o DNA de partida já está degradado ou danificado. Em terceiro lugar, apesar de várias etapas QC são incorporadas no protocolo para verificar a qualidade do DNA, o rendimento final e comprimento das leituras podem ser afetadas pela célula de fluxo e pore a atividade, que pode ser variável nesta fase inicial da plataforma de sequenciamento de nanopore desenvolvimento.
O protocolo descrito aqui usa amostras de linha de células humanas de suspensão para extração de DNA. Otimizamos os tempos de passagem na agulha de corte, a proporção de DNA HMW transposase e o tempo de ligadura para produzir os resultados descritos. O protocolo pode ser expandido de quatro maneiras. Primeiro, os usuários podem começar com outras culturas de células de mamíferos e com quantidade diferente de células, tecidos, amostras clínicas ou outros organismos. Serão necessários mais otimização no tempo de incubação de Lise, volume de reação e centrifugação. Em segundo lugar, é difícil prever o tamanho de destino para o sequenciamento de leitura ultra-longa. Se os comprimentos de leitura são mais curtos do que o esperado, os usuários podem ajustar os tempos de passagem no método baseado em corte mecânico ou alterar a proporção do DNA HMW para transposase no método baseado na fragmentação transposase. Tempo de ligação e eluição durante as etapas de limpeza são úteis porque o DNA HMW é altamente viscoso. Em terceiro lugar, com nanopore diferentes dispositivos de sequenciamento, um pode ajustar a quantidade e o volume do DNA para satisfazer os critérios de sequenciador. Em quarto lugar, apenas aqueles DNA ligado a adaptadores de sequenciamento vai ser sequenciado. Para melhorar ainda mais a eficiência da ligadura, um pode tentar dosear as concentrações de adaptador e ligase. Tempo de ligadura modificados e moleculares crowding agentes como PEG18 podem ser aplicados no futuro. O protocolo de sequenciamento de DNA ultra-longa combinado com CRISPR19,20 pode oferecer uma ferramenta eficaz para o sequenciamento de enriquecimento do alvo.
Os autores declaram que eles têm não tem interesses financeiro concorrente.
Os autores Y. Zhu agradecer seus comentários sobre o manuscrito. Pesquisa reportada nesta publicação foi parcialmente suportada pelo Instituto Nacional de câncer do institutos nacionais da saúde sob prêmio número P30CA034196. O conteúdo é exclusivamente da responsabilidade dos autores e não representa necessariamente a opinião oficial do institutos nacionais da saúde.
Name | Company | Catalog Number | Comments |
Reagents | |||
Absolute ethanol | Sigma-Aldrich | E7023 | |
Agencourt AMPure XPbeads | Beckman | A63881 | magnetic beads for cleanup |
BD conventional needles | Becton Dickinson | 305136 | 27G, for mechanical shearing |
BD Luer-Lok syringe | Becton Dickinson | 309628 | for mechanical shearing |
Blunt/TA Ligase Master Mix | NEB | M0367S | |
Countess Cell Counting Chamber Slides | Invitrogen | C10228 | for cell counting |
EDTA | Invitrogen | AM9261 | pH 8.0, 0.5 M, 500 mL |
Flow Cell | Oxford Nanopore Technologies | FLO-MIN106 | R9.4.1 |
HG00773 cells | Coriell Institute | HG00733 | cells used in this protocol |
Ligation Sequencing Kit 1D | Oxford Nanopore Technologies | SQK-LSK108 | nanopore ligation kit |
MaXtract High Density tubes | Qiagen | 129073 | gel tubes |
NEBNext FFPE DNA Repair Mix | NEB | M6630S | |
NEBNext Ultra II End Repair/dA-Tailing Module | NEB | M7546S | |
Nuclease-free water | Invitrogen | AM9937 | |
Phosphate-Buffered Saline, PBS | Gibco | 70011044 | 10X, pH 7.4 |
Phenol:chloroform:IAA | Invitrogen | AM9730 | |
Proteinase K | Qiagen | 19131 | 20 mg/mL |
Qubit dsDNA BR Assay Kit | Invitrogen | Q32850 | fluorometer assays for DNA quantification |
Rapid Sequencing Kit | Oxford Nanopore Technologies | SQK-RAD004 | nanopore transposase kit |
RNase A | Qiagen | 19101 | 100 mg/mL |
SDS | Invitrogen | AM9822 | 10% (wt/vol) |
Sodium chloride solution | Invitrogen | AM9759 | 5.0 M |
TE buffer | Invitrogen | AM9849 | pH 8.0 |
Tris | Invitrogen | AM9856 | pH 8.0, 1 M |
Triton X-100 solution | Sigma-Aldrich | 93443 | ~10% |
Name | Company | Catalog Number | Comments |
Equipment | |||
Bio-Rad C1000 Thermal Cycler | Bio-Rad | 1851196EDU | |
Centrifuge 5810R | Eppendorf | 22628180 | |
Countess II FL Automated Cell Counter | Life Technologies | AMQAF1000 | for cell counting |
DynaMag-2 Magnet | Life Technologies | 12321D | magnetic rack |
Eppendorf ThermoMixer | Eppendorf | 5382000023 | for incubation |
Freezer | LabRepCo | LHP-5-UFMB | |
GridION | Oxford Nanopore Technologies | GridION X5 | nanopore device used in this protocol |
HulaMixer Sample Mixer | Thermo Fisher Scientific | 15920D | rotator mixer |
MicroCentrifuge | Benchmark Scientific | C1012 | |
NanoDrop ND-1000 Spectrophotometer | Thermo Fisher Scientific | ND-1000 | for UV reading |
Pippin Pulse | Sage Science | PPI0200 | pulsed-field gel electrophoresis instrument |
Qubit 3.0 Fluorometer | Invitrogen | Q33216 | fluorometer |
Refrigerator | LabRepCo | LABHP-5-URBSS | |
Vortex-Genie 2 | Scientific Industries | SI-A236 | |
Water bath | VWR | 89501-464 |
Solicitar permissão para reutilizar o texto ou figuras deste artigo JoVE
Solicitar PermissãoThis article has been published
Video Coming Soon
Copyright © 2025 MyJoVE Corporation. Todos os direitos reservados