JoVE Logo

Entrar

É necessária uma assinatura da JoVE para visualizar este conteúdo. Faça login ou comece sua avaliação gratuita.

Neste Artigo

  • Resumo
  • Resumo
  • Introdução
  • Protocolo
  • Resultados
  • Discussão
  • Divulgações
  • Agradecimentos
  • Materiais
  • Referências
  • Reimpressões e Permissões

Resumo

Análise de sinal-ruído nível de aminoácidos determina a prevalência da variação genética em uma posição de determinado aminoácido normalizada a variação genética de fundo de uma dada população. Isto permite a identificação de variantes "hotspots" dentro de uma sequência da proteína (sinal) que se eleva acima da frequência das variantes raras encontradas em uma população (ruído).

Resumo

Avanços no custo e velocidade de sequenciamento genético de próxima geração têm gerado uma explosão de exome toda clínico e testes de genoma inteiro. Enquanto isto conduziu à maior identificação de prováveis mutações patogénicas associado com síndromes genéticas, dramaticamente também aumentou o número de encontrados incidentalmente variantes genéticas de significado desconhecido (VU). Determinar a significância clínica destas variantes é um grande desafio para os cientistas e clínicos. Análise de sinal-ruído a nível de sequência de proteínas é uma abordagem para ajudar a determinar a probabilidade de patogenicidade. Este protocolo descreve um método para a análise de sinal-ruído nível de aminoácido que utiliza frequência variante em cada posição do ácido aminado da proteína com topologia de proteínas conhecidas para identificar áreas da sequência principal com elevada probabilidade de variação patológica (em relação a variação de população "fundo"). Esse método pode identificar a localização de resíduo de aminoácido "hotspots" de alto sinal patológico, que pode ser usado para refinar o diagnóstico peso de VUSs tais como as identificadas por testes genéticos na próxima geração.

Introdução

A melhoria rápida em plataformas de sequenciamento genético tem revolucionado a acessibilidade e o papel da genética na medicina. Uma vez que se limita a um único gene, ou um punhado de genes, a redução de custos e aumento na velocidade da próxima geração de sequenciamento genético levou rotineiro sequenciamento da totalidade do genoma da codificação de sequência (toda exome sequenciamento, WES) e o genoma inteiro ( sequenciamento do genoma inteiro, WGS) na prática clínica. WES e WGS têm sido utilizados com frequência no cenário de neonatos criticamente doentes e crianças com preocupação para síndrome genética onde é uma ferramenta de diagnóstico comprovada que pode mudar o manejo clínico1,2. Enquanto isto conduziu à maior identificação de prováveis mutações patogénicas associado com síndromes genéticas, dramaticamente também aumentou o número de variantes genéticas encontradas incidentalmente, ou inesperados resultados positivos, de diagnóstico desconhecido significado (VU). Enquanto algumas das variantes são tidas em conta e não relatadas, variantes localizando a genes associados a doenças potencialmente fatais ou altamente mórbidas frequentemente são relatados. As diretrizes atuais recomendam relatórios de incidentais variantes encontradas em genes específicos que podem ser de benefício médico ao paciente, incluindo genes associados com o desenvolvimento de doenças predisponentes de morte cardíacas súbitas como Miocardiopatias e canalopatias3. Embora esta recomendação foi projetada para capturar indivíduos em risco de uma doença SCD-predisponentes, a sensibilidade de detecção de variante excede a especificidade. Isto é refletido em um número crescente de VUSs e aliás identificadas variantes com utilitário de diagnóstico incerto que ultrapassam a frequência das respectivas doenças em uma dada população4. Uma tal doença, síndrome QT longo (LQTS), é um canônico channelopathy cardíaca causada por mutações de localização de genes que codificam os canais iônicos cardíacos, ou canal de interação de proteínas, resultando em atraso repolarização cardíaca5. Este repolarização retardada, vista por um intervalo QT prolongado no eletrocardiograma, de repouso resulta em uma elétrica predisposição para arritmias ventriculares potencialmente fatais como pointes de torsades de. Enquanto um número de genes têm sido associado ao desenvolvimento desta doença, mutações em KCNQ1-codificadoKs potássio canal (KCNQ1, Kv7.1) é a causa do LQTS tipo 1 e é utilizado como um exemplo abaixo de6. Ilustrando a complexidade na interpretação de variante, a presença de raras variantes em genes associados LQTS, assim chamados "variação genética do fundo" tem sido descrito anteriormente7,8.

Compêndio-estilo grandes bases de dados de variantes conhecidas patogênicas, além de várias estratégias existem para predizer que as variantes diferentes do efeito produzirá. Alguns são baseados em algoritmos, tais como SIFT e Polyphen 2, que pode filtrar um grande número de variantes não-sinônimo novela para prever deleteriousness9,10. Apesar do amplo uso dessas ferramentas, baixa especificidade limita sua aplicabilidade quando se trata de "chamar" clínica VUSs11. Análise de "Sinal-ruído" é uma ferramenta que identifica a probabilidade de uma variante a ser associada com doença, com base na frequência de variação patológica conhecida no locus em questão normalizada contra rara variação genética de uma população. Localizando a loci genéticos de variantes onde existe uma elevada prevalência de mutações associadas a doença em comparação com a variação populacional, um alto sinal-ruído, são mais propensos a ser associada a doença de si mesmos. Além disso, raras variantes encontradas incidentalmente localizando a um gene com uma alta frequência das variantes de população rara em comparação com frequência associada a doença, um baixo sinal-ruído, podem ser menos propensos a ser associada a doença. O utilitário de diagnóstico de análise de sinal-ruído tem sido ilustrado nas mais recentes orientações para testes genéticos para cardiomiopatias e canalopatias; no entanto, isso só tem sido empregado no nível do gene inteiro ou específicas de domínio nível12. Recentemente, dado o aumento da disponibilidade de variantes patológicas (doença bancos de dados, estudos de coorte na literatura) e variantes de controle populacional (Exome agregação consórcio, exacerbar e banco de dados de agregação do genoma, GnomAD13), Isto tem sido aplicado para as posições individuais de aminoácidos na sequência primária de uma proteína. Análise de sinal-ruído nível de aminoácido provou útil em categorizar aliás identificadas variantes em genes associados com LQTS como provável variação genética do "fundo", ao invés de doença associada. Entre os três principais genes associados com LQTS, incluindo KCNQ1, essas variantes identificadas por acaso carecia de uma significativa rácios de sinal-ruído, sugerindo que a frequência dessas variantes em posições de aminoácidos individuais refletem rara variação de população ao invés de mutações associadas a doenças. Além disso, quando a topologia de domínio específico da proteína era revestida contra áreas de alta sinal-ruído, patológica mutação "hotspots" localizadas em domínios-chave funcionais das proteínas14. Esta metodologia é uma promessa para determinar que 1) a possibilidade de uma variante é associada a doença ou população e 2) identificando romance críticos domínios funcionais de uma proteína associada à doença humana.

Protocolo

1. identificar o Gene e a isoforma Splice específicas de interesse

Nota: Aqui, vamos mostrar o uso de Ensembl15 para identificar a sequência de consenso para o gene de interesse que está associado com a patogênese da doença de interesse (ou seja, KCNQ1 mutações estão associados com LQTS). Alternativas de Ensembl incluem RefSeq através do National Center for Biotechnology Information (NCBI)16 e da Universidade da Califórnia, Santa Cruz (UCSC) navegador de genoma humano17 (ver Tabela de materiais).

  1. Na homepage Ensembl, selecionar as espécies (ou seja, humano) no menu suspenso e inserir o gene da sigla de interesse no campo (ou seja, KCNQ1). Clique em "Ir"
  2. Selecione o link correspondente ao gene de interesse (ou seja, "KCNQ1 (Gene humano)"
  3. Selecione o link correspondente para a transcrição da ID de interesse turísticos da tabela"transcrição" (ou seja, TranscriptID ENST00000155840.10, NM_000218 [transcrição do RNA], NP_000209 [produto proteico de transcrição do RNA]).
    Nota: Revisão da literatura pertinente é necessária para garantir que a sequência do consenso de transcrição correta está selecionada.
  4. Nota o NM de transcrição específicos e números de identificação de NP para referência futura, encontrado na coluna "RefSeq" da tabela"transcrição".
  5. Selecione o link associado com o número de ID de NP para abrir uma nova página Web da base de dados da proteína de NCBI.
  6. Role para baixo até a seção de "Origem" para obter a sequência (primário) de proteína para a transcrição do gene de interesse.
  7. Role até a seção "Recursos" para obter uma lista das características da proteína (domínios funcionais, domínios de ligação, modificação pós-traducional locais).
    Nota: Esta informação também pode ser obtida através de banco de dados da proteína de NCBI ou de fontes primárias na literatura. Isto será discutido na etapa 5.

2. criar banco variante genético Experimental (o "sinal")

Nota: Aqui, vamos demonstrar como criar um banco de dados de variantes associadas a doença no gene de interesse com a frequência das variantes associadas a doença entre os indivíduos com a doença de interesse. Este banco de dados pode assumir muitas formas e representa o "sinal" (variação genética do fenótipo-positivo) que irá ser normalizado contra o banco de dados variante de controle. Isso pode incluir variantes 1) associada a doença por comparação contra VUSs para identificar novos domínios funcional da proteína e/ou 2) VUSs, incluindo incidentalmente identificados VUSs, para comparar com variantes associadas a doença, para determinar a probabilidade de patogenicidade. Variantes associadas a doença em KCNQ1 serão apresentadas para ilustração; no entanto, o método é o mesmo para análise de VUSs aliás identificada ou qualquer outro conjunto de variantes experimentais.

  1. Identificar cohort(s) de casos índice/probandos não relacionados com a doença de interesse para os quais o gene de interesse foi exaustivamente genótipo para todos os probandos (ou seja, um estudo identifica 24 probandos independentes Hospedagem de variantes em KCNQ1 de 200 indivíduos com LQTS que foram submetidos a interrogatório genético KCNQ1).
    Nota: Estes grupos podem ser identificados de literatura, de análise genética experimental, ou uma combinação de ambos.
    1. Excluir a estudos que não são baseados em coorte (ou seja, um relato de caso descreve um único indivíduo de mutação-positivo), não fornecem o número total de indivíduos de genótipo para o gene de interesse, ou não analisar exaustivamente geneticamente o gene ( ou seja, um "alvo" rastreio genético de exões de KCNQ1 apenas 2-4) estas impedem o cálculo da frequência de uma variante.
    2. Incluem indivíduos que são independentes de probandos e excluem os indivíduos relacionados como isto pode superestimar a variantes frequências (ou seja, um estudo identifica 4 indivíduos independentes com KCNQ1 mutações em uma coorte de 20 pacientes com LQTS. Dentre estes probandos é parte de uma família com 5 outros parentes de mutação-positivo. Excluir todos os membros da família e incluir apenas os 4 probandos independentes).
  2. Compilar todas as variantes genéticas experimentais encontradas em cohort(s) identificados
    1. Atribua a nomenclatura que contém o selvagem-tipo aminoácido, aminoácido posição e variante aminoácido (ou seja, alanina aminoácido número 212 mudado para valina, Ala212Val ou A212V). Um tal tipo de nomenclatura é demonstrado na Figura 1.
    2. Confirme que variante nomenclatura de todas as variantes genéticas experimentais baseia-se a mesma transcrição de gene de referência como observado na etapa 1.4. Se experimental variantes genéticas não são anotadas sobre a transcrição de genes de referência mesmo, então reannotate posição variante de uma transcrição de referência usando o alinhamento de transcrição (consulte a etapa 1.2)
  3. Exclua as variantes que não são aplicáveis dependendo a questão a ser explorada.
    1. Variantes de excluir localizando para regiões não-codificantes do genoma ou variantes que não alterem a proteína sequência como sinônimas, intrônicas variantes, região untranslated 5' ou 3' [UTR] e região intergênica variantes (ou seja, um relatado patológica variante em KCNQ1 que localiza aos 5' UTR de região codificante seria excluída como não prevê-se para alterar a sequência da proteína).
    2. Exclua as variantes que não satisfazem os critérios de inclusão para o estudo. Para variantes associadas a doença, isso inclui variantes que já não são consideradas patológicas.
      1. Confirmar que cada variante é atualmente considerada patogénica, provavelmente patogênicos, ou pelo menos não benigno, por referência cruzada variantes com Banco de dados ClinVar (ver Tabela de materiais).
      2. Entre o gene e a variante de interesse ClinVar campo de pesquisa (ou seja, KCNQ1-Y111C), selecione "Pesquisar"
      3. Identifica a variante de interesse sob a coluna "Variação/localização".
      4. Observe a interpretação do consenso de patogenicidade na coluna "Significado clínico" (ou seja, KCNQ1-Y111C é interpretado como "patogênicas").
      5. Incluir variantes que são "provável patogenicidade" ou "patogênicos".
      6. Incluir variantes com denominações de "interpretações conflitantes de patogenicidade," "significado incerto", ou quando não há registro disponível ("não fornecido") se justifica pelo estudo.
      7. Excluir as variantes designadas como "provavelmente benigna" (ou seja, KCNQ1-A62T).
  4. Calcule a frequência do alelo menor (MAF) de cada posição variante experimental.
    1. Calcule quanto qualquer alelos foram positivos para cada variante respectivo (ou seja, se uma mutação heterozigota é encontrada em 2 indivíduos independentes, o número de alelos variante-positivo-Y111C KCNQ1 é 2).
    2. Calcular o número total de alelos sequenciado dentro da coorte
      1. Observe o número total de indivíduos sequenciados em cada estudo de coorte (passo 2.1)
      2. Multiplique o número total de indivíduos por 2 para determinar o número total de alelos.
        Nota: Isto pressupõe genomas diploides pelo qual cada hosts individuais 2 de cada alelo.
    3. Calcule o número total de indivíduos positivos variante para cada posição do ácido aminado (alelos no passo 2.4.1/alleles na etapa 2.4.2). Por exemplo, se não relacionado 2 indivíduos cada hospedam heterozigotos KCNQ1-Y111C mutações em coortes de 100 e 200 indivíduos LQTS-aflitos, respectivamente, então a frequência das variantes experimentais na posição do ácido aminado 111 é 2 variantes/((100+200 individuals ) * 2 alelos/indivíduo) (ou seja, combinada a MAF 0,0033).
    4. Calcule esse valor para cada variante como o MAF respectivo de cada variante experimental. Para obter detalhes adicionais, consulte Etapa 4.2.

3. criar o controle genético variante de banco de dados (o "ruído")

Nota: Aqui, vamos demonstrar como criar um banco de dados de variantes de controle no gene de interesse com frequência de associados em uma população de controle. Este banco de dados representa o "ruído" (fenótipo-negativo, de base populacional em variação genética) que é o fundo contra o qual o banco de dados variante experimental vai ser normalizado. Isto é referido como variação de "controle".

  1. Identificar um cohort(s) de probandos saudáveis, independentes ou utilizam grandes estudos de base populacional para identificar variantes raras entre uma dada população.
    Nota: As fontes para este banco de dados são diversas e incluem: 1) indivíduos saudáveis e/ou caso contrário fenótipo negativo indivíduos sujeitos a Sanger sequenciamento, ou bases de dados abertas de base populacional de indivíduos para que a doença em questão é rara em frequência como 2) projeto genoma de 1000 (N = 1.094 temas)18, 3) nacional do coração, pulmão e sangue Instituto ir Exome projeto de sequenciamento (ESP, N = 5.379 assuntos)19, 4) Exome agregação consórcio (exacerbar, N = 60.706 assuntos)13 , e/ou 5) banco de dados do genoma agregação (GnomAD, N = 138.632 indivíduos)13 (ver Tabela de materiais). GnomAD banco de dados será utilizado como um exemplo ilustrativo.
    1. Inserir o gene de interesse na caixa de pesquisa na página inicial GnomAD (ou seja, KCNQ1).
    2. Verifique se o navegador selecionado o gene correto e transcrição de interesse (etapa 1.4).
    3. Confirmar que não há cobertura adequada de sequenciamento do locus revendo "cobertura média" e "trama de cobertura".
    4. Selecione para codificação de variação genética sequência selecionando "Missense + LoF."
    5. Selecione "tabela de exportação para CSV," que irá gerar um arquivo de editor de texto chamado "Desconhecido".
    6. Rotule novamente o arquivo e incluir uma nova extensão "*. csv" (ou seja, "KCNQ1 controle Variation.csv").
    7. Abra o arquivo usando um programa de software apropriado para análise de arquivos *. csv (ver Tabela de materiais).
  2. Identificar a proteína mudando a variação genética na coluna rotulada "Proteína consequência."
  3. Aplica critérios de exclusão mesmo para essas variantes genéticas de controle como as variantes genéticas experimentais (passo 2.3.1).
  4. Identifica o MAF de cada variante de controle.
    1. Localize a coluna "Alelo contagem", que denota o número de alelos encontrados para abrigar a variante.
    2. Localize a coluna "Número de alelos", que denota o número total de alelos sequenciado isto dada a posição de ácido amino.
      Nota: O número total de alelos sequenciado irá variar dependendo da cobertura no local. Áreas de cobertura alta vão abordar 2 * número total de indivíduos dentro de GnomAD (ou seja, para 138.632 indivíduos, cobertura completa envolve 277.264 totais alelos genótipo).  Por outro lado, áreas de baixa cobertura terá um número de alelo total reduzido
    3. Localize a variante MAF que pre-é calculado na coluna "Frequência do alelo" e representa "Alelo contagem" dividido por "Alelo número."
      Nota: Genomas humanos têm dois de cada alelo (ou seja, 1 assunto encontrado ter uma variante heterozigota em 10 pessoas tem um MAF de 1/20)
    4. Observe o MAF para cada variante como o MAF respectivo de cada variante de controle.
      Nota: Variante MAF específica para cada grupo racial/étnico composto por GnomAD pode ser visto nas colunas à direita da "Frequência alélica."
  5. Aplicar um limite MAF para variantes raras acima dos quais variantes de controle são excluídas como "comum".
    1. Definir o limite MAF para o valor máximo em que todos os verdadeiramente associada a doença variantes (consulte a etapa 2) também observadas no banco de dados de controle são incluídas abaixo do limiar (isto é, entre todas as doenças associadas KCNQ1 variantes também encontrado em GnomAD o variante comum maior MAF é 0,009, em seguida, devem ser excluídas todas as variantes de GnomAD acima de um limite de 0,01).
  6. Certifique-se de que a nomenclatura variante experimental é idêntica ao controle (consulte a etapa 2.2).
  7. Salve o arquivo. Em alguns casos, isso pode exigir mudando o tipo/extensão de arquivo.

4. mapeamento e cálculo de sinal-ruído nível aminoácido

  1. Calcular uma MAF para cada posição do ácido aminado com uma variante de controle (ver Figura 1 , contendo variantes de GnomAD KCNQ1 exemplo).
    1. Em uma folha de cálculo compatível com gráficos, crie uma coluna das posições de todas as variantes experimentais.
    2. Remova texto variante para deixar apenas a posição de variante.
      Nota: Várias funções/fórmulas pode ser utilizadas para automaticamente excluir esses elementos de texto dentro das células (Figura 1, coluna C; ver Tabela de materiais).
    3. Classificar as variantes no valor ascendente para identificar quais as posições tem mais de 1 variante associado a ele (Figura 1, coluna E; posição de aminoácido ou seja, 10 é listada duas vezes na coluna E que denota 2 variantes exclusivas na posição).
    4. Combine o MAF para cada variante associada a uma determinada posição, levando a soma de todas esta para uma determinada posição (Figura 1, coluna G e H).
  2. Calcular uma MAF para cada posição do ácido aminado com uma variante experimental (ver Figura 2 , contendo simulado KCNQ1 patológicas variantes).
    1. Em uma forma similar a 4.1.1, crie uma coluna de posições de aminoácidos que possuem variantes experimentais (Figura 2, coluna B).
    2. Para cada posição variante, calcule o MAF de todas as variantes associadas com essa posição da etapa 2.4 (Figura 2, coluna C-G).
  3. Criar um rolamento média de MAF para ambos experimental e variantes de controle.
    1. Expandir as colunas criadas em 4.1 e 4.2 para incluir células para posições de aminoácidos que não têm nenhuma variante como um MAF = 0. (Figura 3).
      1. Crie uma coluna que contém todas as posições de aminoácidos no gene de interesse (ou seja, 1 para 676 KCNQ1, Figura 3, coluna C e eu).
      2. Adicione um MAF 0 para todas as posições que não possuem variantes para controle e conjuntos de dados experimentais.
        Nota: Isto pode ser feito automaticamente, utilizando a função "PROCV" em um programa de software comumente utilizado (Figura 3, coluna D e J, consulte Tabela de materiais).
    2. Criar um rolamento média para cada experimental e coluna de prevalência de controle.
      Nota: Isto permite a inferência de patogenicidade posição adjacente e pode ser modificado ou até mesmo excluído, para atender às necessidades do estudo.
      1. Criar uma coluna que representa uma média de MAF para ambos o para controle e conjuntos de dados experimentais (Figura 3, coluna E e K).
      2. Na coluna média rolamento, coloca a média de MAF respectivo para as 5 posições variantes variant N-terminal e 5 posições C-terminal para posição determinada.
        Observação: Isso cria um rolamento média de + /-5. Para posições com menos de 5 resíduos de aminoácidos anteriores, ou após, um rolamento médio local (ou seja, N - ou C-terminal), a média somente levará em conta os resíduos que estão presentes (ou seja, o rolamento média no posição do ácido aminado 3 será uma média de MAF em posições de aminoácido 1 embora 8, calculada como a soma destes esta dividido por 8).
  4. Calcule a frequência de controle mínimo dividindo o menor rolamento MAF por 2.
    1. Altere qualquer célula com um controle MAF de 0 para a frequência mínima para evitar a divisão por 0 ao calcular uma relação sinal-ruído.
  5. Calcule a relação sinal-ruído nível de aminoácidos (Figura 4).
    1. Divida cada posição do ácido aminado experimental rolando média pelo respectivo controle rolando média.
    2. Gráfico desta relação (eixo y) vs aminoácido posição (eixo x).

5. sobreposição de topologia de domínio de proteína

  1. Identifica os locais de aminoácido de consenso dos domínios/características funcionais, ou áreas de modificação pós-traducional, da proteína de interesse (etapa 1.7).
    Nota: Um número de recursos pode ser utilizado para identificar esses domínios. Esses recursos, bem como recursos para a identificação de domínios putativos em novas proteínas, foram bem revisados na literatura20. Este protocolo irá descrever o banco de dados de proteína disponível através do NCBI, que é amplamente utilizado e robusta (ver Tabela de materiais).
  2. Identifica posições de aminoácidos associadas a domínios/características da proteína.
    1. Abra a página da Web do NCBI.
    2. Entra no campo de pesquisa o NP da proteína de interesse.
    3. Identificar domínios da proteína conhecida e características são catálogos em "Recursos".
    4. Identificar e observar as posições de domínio nome/tipo e aminoácidos.
    5. Selecione o link correspondente para o recurso de visualizar a região sobre a proteína da sequência principal de interesse.
  3. Crie uma coluna contendo as fronteiras dos domínios/recursos.
    1. Criar uma coluna ao lado da coluna de sinal: ruído para que a coluna de posição aminoácido pode ser referenciado (Figura 5Acoluna C).
    2. Identificar as células correspondentes na face de cada recurso/domínio N-terminal ou C-terminal e coloque um 1 em cada célula (ou seja, se o domínio N-terminal do domínio transmembrana de KCNQ1 S1 é posição do ácido aminado 122 e o domínio C-terminal é a posição 142 e, em seguida, um 1 é colocado na linha de posição do ácido aminado 122 e 142).
    3. A sobreposição de domínios/recursos, exibir vários domínios, alterando o 1 para outros valores (ou seja, 1.5, 2, 2.5); Isto pode auxiliar na distinção entre domínios.
  4. Crie um gráfico com esses limites como uma posição do eixo y e aminoácidos no eixo x (Figura 5B).
  5. Sobreposição deste gráfico com o gráfico do sinal-ruído criado na etapa 4.4.
  6. Identifica correlações entre domínios/características de proteínas conhecidas e a análise de sinal-ruído.

6. variante posição sobreposição

  1. Mapa de posições variantes individuais para sobreposição de gráficos produzidos em etapas 4.4 e 5.4.
    1. Crie uma coluna ao lado da coluna de recurso/domínio tal que linhas na coluna irão corresponder às posições de aminoácidos (Figura 5Acoluna D).
    2. Coloque um 1 em cada célula na linha adicionada correspondentes a uma posição que contém uma variante respectiva.
    3. Crie um gráfico com esta coluna como uma posição do eixo y e aminoácidos no eixo x (Figura 5-C).
  2. Sobreposição deste gráfico com o gráfico do sinal-ruído criado na etapa 4.4 e gráfico de domínio criado na etapa 5.4.

Resultados

Um resultado representativo para o aminoácido-nível de sinal para análise de ruído para KCNQ1 é retratado na Figura 6. Neste exemplo, raras variantes identificadas a coorte de GnomAD (grupo controle), variantes de WES incidentalmente identificada (coorte experimental #1) e LQTS associadas caso variantes considerado provável doença associada (experimental coorte #2) é retratado. Além disso, a análise de sinal-ruído, comparando a frequência de varia...

Discussão

Testes genéticos do elevado-throughput avançou dramaticamente em sua aplicação e disponibilidade durante a última década. No entanto, em muitas doenças com fundamentos de genéticas bem estabelecidas, como cardiomiopatias, expandido teste falhou melhorar o rendimento diagnóstico21. Além disso, há uma incerteza significativa sobre o utilitário de diagnóstico de muitas variantes identificadas. Isto é parcialmente devido a um número crescente de aliás identificadas variantes raras desc...

Divulgações

Os autores não têm nada para divulgar.

Agradecimentos

APL é suportado pelos institutos nacionais de saúde K08-HL136839.

Materiais

NameCompanyCatalog NumberComments
1000 Genome ProjectN/Awww.internationalgenome.org
ClinVarN/Awww.ncbi.nlm.nih.gov/clinvar
Ensembl Genome BrowserN/Auswest.ensembl.org/index.html
ExcelMicrosoftoffice.microsoft.com/excel/Used for all example formulas and functions
Exome Aggregation Consortium N/Awww.exac.broadinstitute.org
Genome Aggregation Database N/Awww.gnomad.broadinstitute.org
National Center for Biotechnology Information Domain and Structure DatabaseN/Awww.ncbi.nlm.nih.gov/guide/domains-structures/
National Center for Biotechnology Information Gene DatabaseN/Awww.ncbi.nlm.nih.gov/gene/
National Center for Biotechnology Information Protein DatabaseN/Awww.ncbi.nlm.nih.gov/protein/
National Heart, Lung, and Blood Institute GO Exome Sequencing ProjectN/Awww.evs.gs.washington.edu/EVS/
SnapGeneGSL Biotech LCCwww.snapgene.com
University of California, Santa Cruz Human Genome BrowserN/Awww.genome.ucsc.edu

Referências

  1. Yang, Y., et al. Clinical whole-exome sequencing for the diagnosis of mendelian disorders. New England Journal of Medicine. 369 (16), 1502-1511 (2013).
  2. Meng, L., et al. Use of Exome Sequencing for Infants in Intensive Care Units: Ascertainment of Severe Single-Gene Disorders and Effect on Medical Management. Journal of the American Medical Association Pediatrics. 171 (12), 173438 (2017).
  3. Kalia, S. S., et al. Recommendations for reporting of secondary findings in clinical exome and genome sequencing, 2016 update (ACMG SF v2.0): a policy statement of the American College of Medical Genetics and Genomics. Genetics in Medicine. 19 (2), 249-255 (2017).
  4. Landstrom, A. P., Ackerman, M. J. The Achilles' heel of cardiovascular genetic testing: distinguishing pathogenic mutations from background genetic noise. Clinical Pharmacology and Therapeutics. 90 (4), 496-499 (2011).
  5. Landstrom, A. P., Tester, D. J., Ackerman, M. J., Lawless, C. Role of genetic testing for sudden death predisposing heart conditions in athletes. Sports Cardiology Essentials. , (2011).
  6. Wang, Q., et al. Positional cloning of a novel potassium channel gene: KVLQT1 mutations cause cardiac arrhythmias. Nature Genetics. 12 (1), 17-23 (1996).
  7. Kapa, S., et al. Genetic testing for long-QT syndrome: distinguishing pathogenic mutations from benign variants. Circulation. 120 (18), 1752-1760 (2009).
  8. Ackerman, M. J., et al. Ethnic differences in cardiac potassium channel variants: implications for genetic susceptibility to sudden cardiac death and genetic testing for congenital long QT syndrome. Mayo Clinic Proceedings. 78 (12), 1479-1487 (2003).
  9. Kumar, P., Henikoff, S., Ng, P. C. Predicting the effects of coding non-synonymous variants on protein function using the SIFT algorithm. Nature Protocols. 4 (7), 1073-1081 (2009).
  10. Adzhubei, I., Jordan, D. M., Sunyaev, S. R. Predicting functional effect of human missense mutations using PolyPhen-2. Current Protocols in Human Genetics. , (2013).
  11. Flanagan, S. E., Patch, A. M., Ellard, S. Using SIFT and PolyPhen to predict loss-of-function and gain-of-function mutations. Genetic Testing and Molecular Biomarkers. 14 (4), 533-537 (2010).
  12. Ackerman, M. J., et al. HRS/EHRA expert consensus statement on the state of genetic testing for the channelopathies and cardiomyopathies this document was developed as a partnership between the Heart Rhythm Society (HRS) and the European Heart Rhythm Association (EHRA). Heart Rhythm. 8 (8), 1308-1339 (2011).
  13. Lek, M., et al. Analysis of protein-coding genetic variation in 60,706 humans. Nature. 536 (7616), 285-291 (2016).
  14. Landstrom, A. P., et al. Amino acid-level signal-to-noise analysis of incidentally identified variants in genes associated with long QT syndrome during pediatric whole exome sequencing reflects background genetic noise. Heart Rhythm. 15 (7), 1042-1050 (2018).
  15. Hubbard, T., et al. Ensembl 2005. Nucleic Acids Research. 33, 447-453 (2005).
  16. O'Leary, N. A., et al. Reference sequence (RefSeq) database at NCBI: current status, taxonomic expansion, and functional annotation. Nucleic Acids Research. 44, 733-745 (2016).
  17. Kent, W. J., et al. The human genome browser at UCSC. Genome Research. 12 (6), 996-1006 (2002).
  18. The 100 Genome Projects Consortium. An integrated map of genetic variation from 1,092 human genomes. Nature. 491 (7422), 56-65 (2012).
  19. Fu, W., et al. Analysis of 6,515 exomes reveals the recent origin of most human protein-coding variants. Nature. 493 (7331), 216-220 (2013).
  20. Mulder, N. J., Apweiler, R. Tools and resources for identifying protein families, domains and motifs. Genome Biology. 3 (1), (2002).
  21. Cirino, A. L., et al. A Comparison of Whole Genome Sequencing to Multigene Panel Testing in Hypertrophic Cardiomyopathy Patients. Circulation Cardiovascular Genetics. 10 (5), (2017).
  22. Landstrom, A. P., et al. Interpreting Incidentally Identified Variants in Genes Associated With Catecholaminergic Polymorphic Ventricular Tachycardia in a Large Cohort of Clinical Whole-Exome Genetic Test Referrals. Circulation Arrhythmia and Electrophysiology. 10 (4), (2017).
  23. Whiffin, N., et al. Using high-resolution variant frequencies to empower clinical genome interpretation. Genetics in Medicine. 19 (10), 1151-1158 (2017).
  24. Walsh, R., et al. Reassessment of Mendelian gene pathogenicity using 7,855 cardiomyopathy cases and 60,706 reference samples. Genetics in Medicine. 19 (2), 192-203 (2017).
  25. Buske, O. J., Manickaraj, A., Mital, S., Ray, P. N., Brudno, M. Identification of deleterious synonymous variants in human genomes. Bioinformatics. 31 (5), 799 (2015).
  26. Wen, P., Xiao, P., Xia, J. dbDSM: a manually curated database for deleterious synonymous mutations. Bioinformatics. 32 (12), 1914-1916 (2016).
  27. Bagnall, R. D., et al. Whole Genome Sequencing Improves Outcomes of Genetic Testing in Patients With Hypertrophic Cardiomyopathy. Journal of the American College of Cardiology. 72 (4), 419-429 (2018).
  28. Giudicessi, J. R., Roden, D. M., Wilde, A. A. M., Ackerman, M. J. Classification and Reporting of Potentially Proarrhythmic Common Genetic Variation in Long QT Syndrome Genetic Testing. Circulation. 137 (6), 619-630 (2018).
  29. Sundaram, L., et al. Predicting the clinical impact of human mutation with deep neural networks. Nature Genetics. 50, 1161-1170 (2018).
  30. Krittanawong, C., Zhang, H., Wang, Z., Aydar, M., Kitai, T. Artificial Intelligence in Precision Cardiovascular Medicine. Journal of the American College of Cardiology. 69 (21), 2657-2664 (2017).

Reimpressões e Permissões

Solicitar permissão para reutilizar o texto ou figuras deste artigo JoVE

Solicitar Permissão

Explore Mais Artigos

Gen ticaedi o 143an lise gen ticatestes gen ticosmuta otopologiavariante de significado incertosequenciamento de todo exome

This article has been published

Video Coming Soon

JoVE Logo

Privacidade

Termos de uso

Políticas

Pesquisa

Educação

SOBRE A JoVE

Copyright © 2025 MyJoVE Corporation. Todos os direitos reservados