Usamos sequenciamento genético de vírus para tentar entender de onde vêm os vírus e como eles se espalham. E para usar esses dados em tempo real, por exemplo, durante um surto, temos que entender exatamente o quão precisos são os dados que fornecemos. As principais vantagens dessas técnicas são que é relativamente barato, é rápido e permite codificação base em tempo real que pode ser usada para sequenciamento em campo.
Este método pode ser usado para a geração oportuna de dados sequenciais que, por exemplo, podem ser usados para determinar a origem de uma infinidade de patógenos. Essa técnica pode ser complexa para usuários iniciantes e é necessário conhecimento básico do Unix. Especialmente para a instalação dos diferentes pacotes de software.
A visualização deste método ajudará os usuários a determinar a taxa de erro de seus protocolos específicos de sequenciamento. E para responder a perguntas de pesquisa. A sequência é iniciada em um MinION conectado ao MinIT.
Depois de pré-formar uma sequência na plataforma Nanopore, carregue a carga de dados em Porechop. Para evitar contaminação e aumentar a precisão, use a demanda sublinhar dois, ressaltar a bandeira de códigos de barras e digite o comando conforme indicado. Após o des multiplexamento, use cutadapt para remover sequências e sequências de primer com um comprimento menor que 75 nucleotídeos usando o comando como indicado.
Use Minimap2 para mapear leituras de sequência de de multiplex contra o painel de cepas de referência distintas usando Minimap2. E usar Samtools para gerar uma sequência de consenso. Para alinhamentos baseados em referência, é essencial pré-formar uma explosão e pesquisar com a sequência de consenso gerada para identificar a cepa de referência mais próxima.
Em seguida, repita o alinhamento baseado em referência com a cepa de referência mais próxima como referência. Para determinar a cobertura de leitura necessária para compensar o perfil de erro no sequenciamento de Nanopore, selecione o mapeamento de sequência para um Amplicon e use Minimap2 para mapear as leituras de Nanopore contra este Amplicon. Use Samtools para selecionar apenas o mapeamento de leituras para Amplicon26 e converter o arquivo bam em fastq usando os comandos conforme indicado.
Selecione aleatoriamente subconjuntos de, por exemplo, 200 leituras de sequência mil vezes. Todas as leituras de sequência selecionadas aleatoriamente estão alinhadas ao Amplicon26. Use o KMA para mapear as leituras de sequência e para gerar imediatamente uma sequência de consenso usando as configurações otimizadas para sequenciamento de nanopore, conforme indicado pela bandeira bc nano.
Para inspecionar as sequências de consenso geradas, use os comandos conforme indicado. Para exibir a taxa de erro no ponto de estatísticas txt sob o título, bases de incompatibilidades de taxa de erro mapeadas, use o comando conforme indicado. Para exibir o número de indels é exibido sob os indels de título por ciclo use o comando conforme indicado.
Usando a célula de fluxo mais recente em combinação com o flip-flop de cor base, uma cobertura de leitura de 40 vezes resulta em resultados idênticos em comparação com o sequenciamento de Illumina. Uma cobertura de leitura de 30 vezes resulta em uma taxa de erro de 0,02% que corresponde a um erro em cada 585.000 nucleotídeos sequenciados. Enquanto uma cobertura de leitura de 20 vezes resulta em um erro em cada 63, 529 nucleotídeos sequenciados.
Uma leitura de cobertura de 10 vezes resulta em um erro em cada 3.312 nucleotídeos sequenciados. O que significa que mais de 3 nucleotídeos por quatro genomas do vírus Usutu estão sendo chamados de errados. Com uma cobertura de leitura acima de 30 vezes, não são observados indels.
Uma leitura de cobertura de 20 vezes resulta nas detecções de uma posição indel, enquanto uma cobertura de leitura de 10 vezes resulta em indels em 29 posições. O mais importante a se lembrar é que, embora nem sempre aparente, as atualizações no software ocorrem com frequência e podem influenciar os resultados. Existem várias opções de softwares para usar.
Demonstramos os programas mais usados. Mas diferentes softwares e versões diferentes desses softwares podem resultar em resultados diferentes. Mostramos um exemplo de como verificamos a qualidade dos dados de sequência que geramos.
E isso é fundamental para um suporte confiável para surtos.