Determinar la probabilidad de la variable patogenicidad mediante el análisis de Signal-to-Noise del aminoácido-nivel de variación genética

Edward G Jones; Andrew P Landstrom

doi:10.3791/58907

Se requiere una suscripción a JoVE para ver este contenido. Inicie sesión o comience su prueba gratuita.

En este artículo

Resumen
Resumen
Introducción
Protocolo
Resultados
Discusión
Divulgaciones
Agradecimientos
Materiales
Referencias
Reimpresiones y Permisos

Resumen

Análisis de señal a ruido nivel de aminoácidos determina la prevalencia de la variación genética en una posición dada del aminoácido normalizada para la variación genética de fondo de una determinada población. Esto permite la identificación de la variante "puntos calientes" dentro de una secuencia de la proteína (señal) que se eleva por encima de la frecuencia de variantes raras en una población (ruido).

Resumen

Los avances en el costo y la velocidad de secuenciación genética de próxima generación han generado una explosión de exoma toda clínica y pruebas de todo el genoma. Mientras que esto ha llevado a mayor identificación de las mutaciones patógenas probables asociados a síndromes genéticos, ha también aumentado espectacularmente el número de fortuito encontrado variantes genéticas de la significación desconocida (VUS). Determinar la significación clínica de estas variantes es un gran desafío para los científicos y médicos. Un enfoque para ayudar a determinar la probabilidad de patogenicidad es análisis de señal a ruido en el nivel de secuencia de la proteína. Este protocolo describe un método para el análisis de señal a ruido nivel de aminoácidos que aprovecha la frecuencia variante en cada posición del aminoácido de la proteína con la topología de la proteína conocida para identificar las áreas de la secuencia principal con elevada probabilidad de variación patológica (en relación con la variación de población "fondo"). Este método puede identificar la ubicación de residuos del aminoácido 'hotspots' de alta señal patológica, que se puede utilizar para refinar el peso diagnóstico de VUSs como los identificados por pruebas genéticas de próxima generación.

Introducción

La mejora rápida en plataformas de secuenciación genética ha revolucionado la accesibilidad y el papel de la genética en medicina. Una vez confinado a un solo gen, o un puñado de genes, la reducción de costos y aumento en la velocidad de próxima generación de secuenciación genética ha llevado la secuencia sistemática de la totalidad del genoma de secuencia de codificación (secuenciación del exoma completo, WES) y la totalidad del genoma ( secuenciación del genoma entero, WGS) en el ajuste clínico. WES y WGS han utilizado con frecuencia en el ajuste de los recién nacidos críticamente enfermos y niños con preocupación por síndrome genético que es una probada herramienta de diagnóstico que puede cambiar el manejo clínico¹^,². Mientras que esto ha llevado a mayor identificación de las mutaciones patógenas probables asociados a síndromes genéticos, ha aumentado dramáticamente el número de variantes genéticas por cierto encontradas o resultados positivos inesperados, de diagnóstico desconocido significación (VUS). Mientras que algunas de estas variantes son ignorados y no divulgados, variantes localizar a genes asociados a enfermedades potencialmente mortales o altamente morbosas se divulgan a menudo. Las directrices actuales recomiendan informes incidentales variantes en genes específicos que pueden ser de beneficio médico al paciente, incluyendo genes asociados con el desarrollo de repentinas enfermedades cardíacas predisponentes de muerte como miocardiopatías y canalopatías³. Aunque esta recomendación fue diseñada para capturar a personas en riesgo de una enfermedad predisponente de SCD, la sensibilidad de la detección de variantes supera especificidad. Esto se refleja en un número creciente de VUSs y por cierto identificado variantes con la utilidad de diagnóstico claro que exceden por mucho la frecuencia de las respectivas enfermedades en una población de⁴. Una de esas enfermedades, síndrome de QT largo (SQTL) es una canónica channelopathy cardiaca causada por mutaciones de localizar a los genes que codifican los canales iónicos cardiacos, o canal de interacción de proteínas, dando por resultado retrasa la repolarización cardiaca⁵. Esta repolarización retardada, vista por un intervalo QT prolongado en el electrocardiograma de reposo resulta en una eléctrica predisposición a arritmias ventriculares potencialmente fatales como el de pointes de torsades. Mientras que un número de genes se han relacionado con el desarrollo de esta enfermedad, las mutaciones en KCNQ1-codificado en_Ks potasio canal (KCNQ1, Kv7.1) es la causa del SQTL tipo 1 y es utilizado como un ejemplo a continuación⁶. Ilustrando la complejidad de la interpretación variable, la presencia de variantes raras de genes SQTL asociado, llamados "variación genética de fondo" ha sido descrito previamente⁷^,⁸.

Además de compendio-estilo grande bases de datos de variantes patógenas conocidas varias estrategias existen para la predicción de que las diversas variantes de efecto producirá. Algunos se basan en algoritmos, como SIFT y Polyphen 2, que puede filtrar gran cantidad de nuevas variantes no sinónimo para predecir deleteriousness⁹^,¹⁰. A pesar del amplio uso de estas herramientas, baja especificidad limita su aplicabilidad cuando se trata de "llamando" clínica VUSs¹¹. Análisis de "Signal to noise" es una herramienta que identifica la probabilidad de que una variante se asoció a enfermedad basada en la frecuencia de la conocida variación patológica en el locus en cuestión normalizada contra rara variación genética de una población. Localización de loci genéticos variantes donde hay una alta prevalencia de mutaciones enfermedad-asociadas en comparación con la variación poblacional, un gran señal-ruido, son más propensos a ser asociada a enfermedad de ellos mismos. Variantes más, raras encontrar localizar a un gen con una alta frecuencia de variantes de población rara por cierto comparado con frecuencia asociada a la enfermedad, un baja señal-ruido, puede ser menos probables que asociada a la enfermedad. La utilidad de diagnóstico de análisis de señal a ruido ha sido ilustrada en las últimas guías para las pruebas genéticas para las miocardiopatías y canalopatías; sin embargo, sólo se ha empleado en el nivel del gene entero o nivel específico de dominio¹². Recientemente, dado el aumento de la disponibilidad de variantes patológicas (bases de datos de la enfermedad, estudios de cohortes en la literatura) y variantes de control poblacional (Consorcio de agregación exoma, ExAC y la base de datos de genoma agregación, GnomAD¹³), Esto se ha aplicado a las posiciones de cada aminoácido en la secuencia primaria de una proteína. Análisis de señal a ruido nivel de aminoácidos ha demostrado su utilidad en la categorización por cierto identificadas variantes en los genes asociados con SQTL como probable variación genética del "fondo" en lugar de enfermedad asociados. Entre los tres genes principales asociados con SQTL, incluyendo KCNQ1, estas variantes identificadas por cierto carecían de un significativo cocientes signal-to-noise, lo que sugiere que la frecuencia de estas variantes en las posiciones de aminoácidos individuales reflejan rara variación de la población en lugar de mutaciones asociadas a la enfermedad. Además, cuando la topología de dominio específico de la proteína era overlaid contra áreas de alta señal a ruido, patológica mutación 'hotspots' localizadas a dominios funcionales claves de las proteínas¹⁴. Esta metodología es prometedor para determinar que 1) la probabilidad de una variante está asociada enfermedad o población y 2) identificando nuevos dominios funcionales críticos de una proteína asociada a la enfermedad humana.

Protocolo

1. identificar los genes y empalme específica de isoforma de interés

Nota: Aquí, se demuestra el uso de Ensembl¹⁵ para identificar la secuencia de consenso para el gen de interés que se asocia con la patogenia de la enfermedad de interés (es decir, KCNQ1 mutaciones se asocian a LQTS). Alternativas a Ensembl incluyen RefSeq vía el Centro Nacional de información biotecnológica (NCBI)¹⁶ y la Universidad de California, Santa Cruz (UCSC) genoma humano explorador¹⁷ (véase Tabla de materiales).

En la página de Ensembl, seleccionar la especie (es decir, humanos) en el menú desplegable y escriba el gene de siglas de interés en el campo (es decir, KCNQ1). Haga clic en "Go"
Seleccione el vínculo correspondiente al gen de interés (es decir, "KCNQ1 (gen humano)"
Seleccione el vínculo correspondiente a la transcripción del DNI de interés de interés de la "tabla de transcripción" (es decir, TranscriptID ENST00000155840.10, NM_000218 [transcripción de RNA], NP_000209 [producto de la proteína de transcripción RNA]).
Nota: La revisión de la literatura pertinente es necesaria para garantizar que la secuencia de consenso de la transcripción correcta es seleccionada.
Nota el NM de transcripción específicos y números de identificación de NP para futura referencia en la columna "RefSeq" de la "tabla de transcripción".
Seleccione el vínculo asociado con el número de identificación de NP para abrir una nueva página web de la base de datos de la proteína de NCBI.
Desplácese hacia abajo hasta la sección "Origen" para obtener la secuencia de la proteína (primaria) para la transcripción del gen de interés.
Desplácese hasta la sección "Características" para obtener una lista de las características de la proteína (dominios funcionales, dominios de Unión, sitios de modificación poste-de translación).
Nota: Esta información también se puede obtener a través de la base de datos de la proteína de NCBI o de fuentes primarias en la literatura. Esto se discutirá más en el paso 5.

2. crear la genética variante base de datos Experimental (la "señal")

Nota: Aquí se demuestra cómo crear una base de datos de variantes asociadas a la enfermedad en el gen de interés con la frecuencia de las variantes asociadas a la enfermedad entre los individuos con la enfermedad de interés. Esta base de datos puede tomar muchas formas y representa la "señal" (variación genética del fenotipo positivo) que se normalizó la base de datos de variables de control. Esto puede incluir variantes 1) asociada a enfermedad de comparación contra VUSs identificar nuevos dominios funcionales de la proteína o 2) VUSs, incluyendo por cierto identificados VUSs, comparar contra variantes asociadas a la enfermedad para determinar la probabilidad de patogenicidad. Variantes asociadas a enfermedad en KCNQ1 se presentará para la ilustración; sin embargo, el método es el mismo para el análisis de VUSs identificados incidentalmente o cualquier otro conjunto de variantes experimentales.

Identificar cohort(s) de casos índice/probands sin relación con la enfermedad de interés para que el gen de interés era comprensivo genotipado para probands todos (es decir, un estudio identifica 24 probands sin relación hosting variantes en KCNQ1 de 200 individuos con SQTL que fueron sometidos a interrogatorio genético KCNQ1).
Nota: Estas cohortes se pueden identificar de la literatura, de análisis genética experimental, o una combinación de ambos.
1. Excluir estudios que no están basados en la cohorte (es decir, un informe del caso describe un individuo mutación-positivo), no proporciona el número total de individuos de genotipados para el gen de interés, o no analizar exhaustivamente genéticamente el gen ( es decir, un análisis genético "selectivas" de KCNQ1 sólo los exones 2-4) estas imposibilitan el cálculo de la frecuencia de una variante.
2. Son a personas que están sin relación probands y excluyen a individuos emparentados como esto puede sobreestimar las frecuencias variables (es decir, un estudio identifica a 4 individuos no emparentados con las mutaciones KCNQ1 en una cohorte de 20 pacientes con SQTL. Uno de los probands es parte de una familia con 5 otros parientes de mutación-positivo. Excluir a todos los miembros de la familia e incluyen sólo los probands sin relación 4).
Compilar todas las variantes genéticas experimentales encontradas cohort(s) identificado
1. Asignar nomenclatura que contiene el tipo de aminoácido, aminoácido posición y variante del aminoácido (es decir, alanina aminoácido número 212 cambiada a la valina, Ala212Val o A212V). Un tal tipo de nomenclatura se demuestra en la figura 1.
2. Confirmar que la variante nomenclatura de todas las variantes genéticas experimentales se basa en la misma transcripción del gene de la referencia como se indica en el paso 1.4. Si experimentales variantes genéticas no se anotan en la misma transcripción de gen de referencia, entonces reannotate posición variante a una transcripción de referencia mediante alineación de transcripción (véase el paso 1.2)
Excluir las variantes que no son aplicables dependiendo de la pregunta que se está estudiando.
1. Excluir las variantes localizar a regiones no codificantes del genoma o de variantes que no alteran la proteína secuencia como variantes intrónicas, sinónimas, 5' o 3' región sin traducir [NC] y la región intergénica variantes (es decir, un informado patológica variante de KCNQ1 que localiza a los 5' UTR de la región de la codificación sería excluido como no está previsto modificar la secuencia de la proteína).
2. Excluir las variantes que no cumplen criterios de inclusión para el estudio. Para variantes asociadas a la enfermedad, esto incluye variantes que ya no se considerarán patológicas.
  1. Confirman que cada variante es actualmente considerado patógeno, probablemente patógeno, o por lo menos no benigno, por variantes con la base de datos de ClinVar de referencias cruzadas (véase Tabla de materiales).
  2. Entre el gen y variante de interés en ClinVar campo de búsqueda (es decir, KCNQ1-Y111C), seleccione "Buscar"
  3. Identificar la variante de interés bajo la columna "Ubicación de variación".
  4. Tenga en cuenta la interpretación del consenso de patogenicidad bajo la columna de "Significación clínica" (es decir, KCNQ1-Y111C se interpreta como "patógeno").
  5. Incluyen variantes que son "probablemente patógeno" o "patógenos".
  6. Incluyen variantes con las denominaciones de "interpretaciones contradictorias de patogenicidad," "significado incierto", o cuando ningún registro está disponible ("no proporcionado") si se justifica el estudio.
  7. Excluir las variantes designadas como "probablemente benigna" (es decir, KCNQ1-A62T).
Calcular la frecuencia del alelo menor (MAF) de cada posición variante experimental.
1. Calcular cómo cualquier alelos fueron positivos para cada variante respectiva (es decir, si una mutación heterozigótica de se encuentra en 2 individuos no emparentados, el número de alelos variante positiva de KCNQ1-Y111C es 2).
2. Calcular el número total de alelos ordenados dentro de la cohorte
  1. Tenga en cuenta el número total de individuos ordenados en cada estudio de cohortes (paso 2.1)
  2. Multiplica al número total de individuos por 2 para determinar el número total de alelos.
    Nota: Esto presupone genomas diploides que cada hosts individuales 2 de cada alelo.
3. Calcular el número total de individuos de la variante positiva para cada posición del aminoácido (alelos en paso 2.4.1/alleles paso 2.4.2). Por ejemplo, si 2 no relacionado con individuos cada anfitrión KCNQ1-Y111C las mutaciones heterozigóticas en cohortes de individuos afectados de SQTL 100 y 200, respectivamente, entonces la frecuencia de las variantes experimentales del aminoácido posición 111 es 2 variantes/((100+200 individuals ) * 2 alelos/individuo) (es decir, combinar MAF 0.0033).
4. Calcular este valor para cada variante como el MAF respectivo de cada variante experimental. Para obtener más detalles consulte el paso 4.2.

3. crear el Control genético variante base de datos (el "ruido")

Nota: Aquí se demuestra cómo crear una base de datos de variantes en el gen de interés con una frecuencia asociada en una población de control. Esta base de datos representa el "ruido" (fenotipo negativo, basado en la población variación genética) que es el fondo contra el cual se normalizará la base de datos de variable experimental. Esto se conoce como variación de "control".

Identificar un cohort(s) de probands sano, sin relación o utilizar grandes estudios poblacionales para identificar variantes raras en una población dada.
Nota: Las fuentes para esta base de datos son diversas e incluyen: 1) individuos sanos y/o individuos de fenotipo negativo lo contrario sometidos a Sanger secuenciación o bases de datos públicas de personas basado en la población para que la enfermedad en cuestión es raro en frecuencia como 2) proyecto del genoma 1000 (N = 1.094 temas)¹⁸, 3) nacional del corazón, pulmón y sangre ir Instituto proyecto de secuenciación exoma (ESP, N = 5.379 sujetos)¹⁹, 4) exoma Consorcio de agregación (ExAC, N = 60.706 temas)¹³, o 5) base de datos de genoma agregación (GnomAD, N = 138.632 individuos)¹³ (véase Tabla de materiales). La base de datos de GnomAD será utilizado como un ejemplo ilustrativo.
1. Introducir el gen de interés en el cuadro de búsqueda en la Página Web de GnomAD (es decir, KCNQ1).
2. Confirmar que el navegador había seleccionado el gen correcto y transcripción de interés (paso 1.4).
3. Confirme que existe cobertura adecuada de la secuencia del locus revisando "cobertura media" y "trama de la cobertura."
4. Seleccione para la codificación de variación genética de la secuencia seleccionando "Sin sentido" +"LoF".
5. Seleccione "Exportar tabla a CSV," que generará un archivo TextEdit llamado "Desconocido".
6. Cambiarle el archivo e incluyen una nueva extensión "*.csv" (es decir, "KCNQ1 Control Variation.csv").
7. Abra el archivo usando un programa de software apropiado para el análisis de archivos *.csv (véase Tabla de materiales).
Identificar la proteína cambiando la variación genética en la columna etiquetada "Proteína consecuencia."
Mismos criterios de exclusión se aplican a estas variantes genéticas de control como el experimentales variantes genéticas (paso 2.3.1).
Identificar el MAF de cada variante de control.
1. Localizar la columna de "Alelo" conteo", que denota el número de alelos encontrados para la variante del puerto.
2. Localizar la columna "Número de alelos", que denota el número total de alelos secuenciados en este dada la posición de ácido amino.
  Nota: El número total de alelos secuenciadas variará dependiendo de la cobertura en ese lugar. Áreas de cobertura alta aproximará a 2 * número total de individuos dentro de GnomAD (es decir, para los 138.632 individuos, cobertura completa abarca 277.264 total alelos genotipados). Por el contrario, áreas de cobertura más bajada tendrá un número reducido alelo total
3. Localizar la variante MAF que previamente se calcula en la columna "Frecuencia de alelo" y representa "Alelo cuenta" dividido por"alelo."
  Nota: Los genomas humanos tienen dos de cada alelo (es decir, 1 tema encontraron que una variante heterozigótica en 10 personas tiene un MAF del 1 al 20)
4. Tenga en cuenta el MAF para cada variante como el MAF respectivo de cada variante de control.
  Nota: Variante MAF específico para cada grupo racial o étnico compuesto por GnomAD puede verse en las columnas a la derecha de «Frecuencia de alelo.»
Aplicar un umbral MAF para variantes raras que excluyen a variantes como "común".
1. Ajuste del umbral de MAF para el valor máximo en el que todos verdaderamente asociada a enfermedad variantes (ver paso 2) también se observó en la base de datos de control se incluyen por debajo del umbral (es decir, entre todas enfermedades asociadas KCNQ1 las variantes también se encuentra en GnomAD el la variante común más alto MAF es 0.009, deben excluirse todas las variantes de GnomAD encima de un umbral de 0.01).
Asegúrese de que la nomenclatura variante experimental es idéntica al control (vea el paso 2.2).
Guarde el archivo. En algunos casos, esto puede requerir cambiar la extensión del tipo del archivo.

4. asignación y cálculo de señal a ruido nivel aminoácido

Calcular un MAF para cada posición del aminoácido con una variante de control (ver figura 1 que contiene variantes de KCNQ1 GnomAD ejemplo).
1. En una hoja de cálculo compatible con gráficos, crear una columna de las posiciones de todas las variantes experimentales.
2. Eliminar texto variable para dejar sólo la posición variable.
  Nota: Se pueden utilizar diversas funciones/fórmulas para eliminar automáticamente los elementos del texto dentro de las células (figura 1, columna C, véase Tabla de materiales).
3. Ordenar las variantes de valor ascendente a identificar que puestos tienen más de 1 variante asociada (figura 1, columna E; es decir, del aminoácido de posición 10 aparece dos veces en la columna E que denota 2 únicas variantes en la posición).
4. Combinar el MAF para cada variante asociada a una determinada posición al tomar la suma de todos MAFs para una determinada posición (figura 1, columna G y H).
Calcular un MAF para cada posición del aminoácido con una variante experimental (véase la figura 2 que contiene simulacros KCNQ1 variantes patológicas).
1. De manera similar a 4.1.1, crear una columna de posiciones de aminoácidos que tienen variantes experimentales (figura 2, columna B).
2. Para cada posición variable, calcular el MAF de todas las variantes asociadas con esa posición del paso 2.4 (figura 2, columna C-G).
Crear un balanceo medio del MAF para ambos experimental y variantes.
1. Ampliar las columnas creadas en 4.1 y 4.2 para incluir células para posiciones de aminoácidos que no tienen ninguna variante como un MAF = 0. (Figura 3).
  1. Crear una columna que contiene todas las posiciones del aminoácido en el gen de interés (es decir, 1 a 676 para columna de KCNQ1, figura 3, C e I).
  2. Añadir un MAF de 0 para todas las posiciones que no tienen variantes para el control y conjuntos de datos experimentales.
    Nota: Esto puede hacerse automáticamente utilizando la función "BUSCARV" en un programa de software comúnmente utilizadas (figura 3, columna D y J, véase Tabla de materiales).
2. Crear un balanceo promedio para cada uno experimental y control prevalencia columna.
  Nota: Esto permite la inferencia de patogenicidad posición adyacente y puede ser modificado o excluido, para satisfacer las necesidades del estudio.
  1. Crear una columna que representa una media acumulada de MAF tanto para el control y conjuntos de datos experimentales (figura 3, columna E y K).
  2. En la columna promedio rodante, coloque el medio del MAF respectivo para las 5 posiciones variante variante N-terminal y 5 posiciones C-terminal en la posición dada.
    Nota: Esto crea un balanceo medio de +-5. Para posiciones con menos de 5 residuos del aminoácido anteriores, o después, un lugar medio rodante (es decir, la terminal N o C), la media acumulada sólo tendrá en cuenta los residuos que están presentes (es decir, el balanceo promedio en posición del aminoácido 3 será un promedio del MAF en posiciones del aminoácido 1 aunque 8, calculado como la suma de estos MAFs dividido por 8).
Calcular la frecuencia mínima de control dividiendo el menor balanceo MAF 2.
1. Cambia cualquier celda con un control MAF de 0 a la frecuencia mínima para evitar dividir por 0 al calcular una relación señal a ruido.
Calcular la razón de señal a ruido nivel de aminoácidos (figura 4).
1. Dividir cada posición del aminoácido experimental promedio del balanceo por el control respectivo balanceo medio.
2. El gráfico esta posición de relación (eje y) vs aminoácidos (eje x).

5. proteína dominio topología superposición

Identificar las ubicaciones de aminoácido de consenso de dominios/características funcionales o áreas de modificación poste-de translación de la proteína de interés (paso 1.7).
Nota: Un número de recursos puede ser utilizado para identificar estos dominios. Estos recursos, así como recursos para la identificación de dominios putativos en nuevas proteínas, han sido bien revisadas en la literatura²⁰. Este protocolo describe la proteína base de datos a través de NCBI, que es ampliamente utilizado y robusto (véase Tabla de materiales).
Identificar posiciones de aminoácidos asociados a proteína dominios/características.
1. Abra la página web del NCBI.
2. Introduzca el PN de la proteína de interés en el campo de búsqueda.
3. Identificar los dominios de la proteína conocida y características son catálogos bajo "Características."
4. Identificar y observar las posiciones de dominio nombre, tipo y aminoácidos.
5. Seleccione el vínculo correspondiente a la función para visualizar la región de la proteína de secuencia principal de interés.
Crear una columna que contiene los límites de las características de los dominios.
1. Crear una columna al lado de la columna de señal: ruido para que la columna de la posición de aminoácidos puede ser referenciado (figura 5A, columna C).
2. Identificar las células correspondientes en el aspecto de cada función dominio N-terminal o c-terminal y coloque un 1 en cada celda (es decir, si el dominio N-terminal del dominio transmembrana de S1 de KCNQ1 es aminoácido posición 122, y el dominio C-terminal posición 142, luego un 1 se coloca en la fila de la posición del aminoácido 122 y 142).
3. Para la superposición de dominios/características, Mostrar múltiples dominios cambiando el 1 por otros valores (es decir, 1.5, 2, 2.5); Esto puede ayudar en la distinción de dominios.
Crear un gráfico con estos límites como una posición de eje y y del aminoácido en el eje x (figura 5B).
El recubrimiento esta gráfica con la gráfica de señal a ruido creada en el punto 4.4.
Identificar correlaciones entre dominios/características de la proteína conocida y el análisis de señal a ruido.

6. variante de la posición recubrimiento

Mapa de posiciones individuales variante por superposición de gráficos producidos en medidas 4.4 y 5.4.
1. Crear una columna al lado de la columna de función dominio tal que las filas de la columna se corresponden a posiciones de aminoácidos (figura 5A, columna D).
2. Ponga un 1 en cada celda de la fila agregada correspondiente a una posición que contenga una variante respectiva.
3. Crear un gráfico con esta columna como una posición de eje y y del aminoácido en el eje x (figura 5C).
Superponer este gráfico con el gráfico de señal a ruido creado en el punto 4.4 y gráfico de dominio creado en el paso 5.4.

Resultados

Un resultado representativo para señal de nivel de aminoácidos análisis de ruido de KCNQ1 se representa en la figura 6. En este ejemplo, variantes raras identificadas en la cohorte de GnomAD (cohorte de control), identificado por cierto WES variantes (experimental cohorte #1) y variantes de SQTL asociado caso consideran probable asociada a la enfermedad (experimental cohorte #2) se describe. Además, el análisis de señal a ruido que comparan la frecuenci...

Discusión

Pruebas genéticas de alto rendimiento ha avanzado considerablemente en su aplicación y la disponibilidad de la última década. Sin embargo, en muchas enfermedades con bases genéticas bien establecidas, como las miocardiopatías, la prueba ampliada ha podido mejorar rendimiento diagnóstico²¹. Además, existe considerable incertidumbre con respecto a la utilidad de diagnóstico de muchas variantes identificadas. Esto es parcialmente debido a un creciente número de variantes raras por cierto id...

Divulgaciones

Los autores no tienen nada que revelar.

Agradecimientos

APL es apoyado por el nacional institutos de salud K08-HL136839.

Materiales

Name	Company	Catalog Number	Comments
1000 Genome Project	N/A	www.internationalgenome.org
ClinVar	N/A	www.ncbi.nlm.nih.gov/clinvar
Ensembl Genome Browser	N/A	uswest.ensembl.org/index.html
Excel	Microsoft	office.microsoft.com/excel/	Used for all example formulas and functions
Exome Aggregation Consortium	N/A	www.exac.broadinstitute.org
Genome Aggregation Database	N/A	www.gnomad.broadinstitute.org
National Center for Biotechnology Information Domain and Structure Database	N/A	www.ncbi.nlm.nih.gov/guide/domains-structures/
National Center for Biotechnology Information Gene Database	N/A	www.ncbi.nlm.nih.gov/gene/
National Center for Biotechnology Information Protein Database	N/A	www.ncbi.nlm.nih.gov/protein/
National Heart, Lung, and Blood Institute GO Exome Sequencing Project	N/A	www.evs.gs.washington.edu/EVS/
SnapGene	GSL Biotech LCC	www.snapgene.com
University of California, Santa Cruz Human Genome Browser	N/A	www.genome.ucsc.edu

Referencias

Yang, Y., et al. Clinical whole-exome sequencing for the diagnosis of mendelian disorders. New England Journal of Medicine. 369 (16), 1502-1511 (2013).
Meng, L., et al. Use of Exome Sequencing for Infants in Intensive Care Units: Ascertainment of Severe Single-Gene Disorders and Effect on Medical Management. Journal of the American Medical Association Pediatrics. 171 (12), 173438 (2017).
Kalia, S. S., et al. Recommendations for reporting of secondary findings in clinical exome and genome sequencing, 2016 update (ACMG SF v2.0): a policy statement of the American College of Medical Genetics and Genomics. Genetics in Medicine. 19 (2), 249-255 (2017).
Landstrom, A. P., Ackerman, M. J. The Achilles' heel of cardiovascular genetic testing: distinguishing pathogenic mutations from background genetic noise. Clinical Pharmacology and Therapeutics. 90 (4), 496-499 (2011).
Landstrom, A. P., Tester, D. J., Ackerman, M. J., Lawless, C. Role of genetic testing for sudden death predisposing heart conditions in athletes. Sports Cardiology Essentials. , (2011).
Wang, Q., et al. Positional cloning of a novel potassium channel gene: KVLQT1 mutations cause cardiac arrhythmias. Nature Genetics. 12 (1), 17-23 (1996).
Kapa, S., et al. Genetic testing for long-QT syndrome: distinguishing pathogenic mutations from benign variants. Circulation. 120 (18), 1752-1760 (2009).
Ackerman, M. J., et al. Ethnic differences in cardiac potassium channel variants: implications for genetic susceptibility to sudden cardiac death and genetic testing for congenital long QT syndrome. Mayo Clinic Proceedings. 78 (12), 1479-1487 (2003).
Kumar, P., Henikoff, S., Ng, P. C. Predicting the effects of coding non-synonymous variants on protein function using the SIFT algorithm. Nature Protocols. 4 (7), 1073-1081 (2009).
Adzhubei, I., Jordan, D. M., Sunyaev, S. R. Predicting functional effect of human missense mutations using PolyPhen-2. Current Protocols in Human Genetics. , (2013).
Flanagan, S. E., Patch, A. M., Ellard, S. Using SIFT and PolyPhen to predict loss-of-function and gain-of-function mutations. Genetic Testing and Molecular Biomarkers. 14 (4), 533-537 (2010).
Ackerman, M. J., et al. HRS/EHRA expert consensus statement on the state of genetic testing for the channelopathies and cardiomyopathies this document was developed as a partnership between the Heart Rhythm Society (HRS) and the European Heart Rhythm Association (EHRA). Heart Rhythm. 8 (8), 1308-1339 (2011).
Lek, M., et al. Analysis of protein-coding genetic variation in 60,706 humans. Nature. 536 (7616), 285-291 (2016).
Landstrom, A. P., et al. Amino acid-level signal-to-noise analysis of incidentally identified variants in genes associated with long QT syndrome during pediatric whole exome sequencing reflects background genetic noise. Heart Rhythm. 15 (7), 1042-1050 (2018).
Hubbard, T., et al. Ensembl 2005. Nucleic Acids Research. 33, 447-453 (2005).
O'Leary, N. A., et al. Reference sequence (RefSeq) database at NCBI: current status, taxonomic expansion, and functional annotation. Nucleic Acids Research. 44, 733-745 (2016).
Kent, W. J., et al. The human genome browser at UCSC. Genome Research. 12 (6), 996-1006 (2002).
The 100 Genome Projects Consortium. An integrated map of genetic variation from 1,092 human genomes. Nature. 491 (7422), 56-65 (2012).
Fu, W., et al. Analysis of 6,515 exomes reveals the recent origin of most human protein-coding variants. Nature. 493 (7331), 216-220 (2013).
Mulder, N. J., Apweiler, R. Tools and resources for identifying protein families, domains and motifs. Genome Biology. 3 (1), (2002).
Cirino, A. L., et al. A Comparison of Whole Genome Sequencing to Multigene Panel Testing in Hypertrophic Cardiomyopathy Patients. Circulation Cardiovascular Genetics. 10 (5), (2017).
Landstrom, A. P., et al. Interpreting Incidentally Identified Variants in Genes Associated With Catecholaminergic Polymorphic Ventricular Tachycardia in a Large Cohort of Clinical Whole-Exome Genetic Test Referrals. Circulation Arrhythmia and Electrophysiology. 10 (4), (2017).
Whiffin, N., et al. Using high-resolution variant frequencies to empower clinical genome interpretation. Genetics in Medicine. 19 (10), 1151-1158 (2017).
Walsh, R., et al. Reassessment of Mendelian gene pathogenicity using 7,855 cardiomyopathy cases and 60,706 reference samples. Genetics in Medicine. 19 (2), 192-203 (2017).
Buske, O. J., Manickaraj, A., Mital, S., Ray, P. N., Brudno, M. Identification of deleterious synonymous variants in human genomes. Bioinformatics. 31 (5), 799 (2015).
Wen, P., Xiao, P., Xia, J. dbDSM: a manually curated database for deleterious synonymous mutations. Bioinformatics. 32 (12), 1914-1916 (2016).
Bagnall, R. D., et al. Whole Genome Sequencing Improves Outcomes of Genetic Testing in Patients With Hypertrophic Cardiomyopathy. Journal of the American College of Cardiology. 72 (4), 419-429 (2018).
Giudicessi, J. R., Roden, D. M., Wilde, A. A. M., Ackerman, M. J. Classification and Reporting of Potentially Proarrhythmic Common Genetic Variation in Long QT Syndrome Genetic Testing. Circulation. 137 (6), 619-630 (2018).
Sundaram, L., et al. Predicting the clinical impact of human mutation with deep neural networks. Nature Genetics. 50, 1161-1170 (2018).
Krittanawong, C., Zhang, H., Wang, Z., Aydar, M., Kitai, T. Artificial Intelligence in Precision Cardiovascular Medicine. Journal of the American College of Cardiology. 69 (21), 2657-2664 (2017).

Reimpresiones y Permisos

Solicitar permiso para reutilizar el texto o las figuras de este JoVE artículos

Solicitar permiso

Explorar más artículos

Gen tica n mero 143 an lisis gen tico pruebas gen ticas mutaci n topolog a variante de significado incierto secuenciaci n del exoma completo

This article has been published

Video Coming Soon

Keep me updated: