Análisis de señal a ruido a nivel de aminoácidos, proporciona una medida de la probabilidad de que una variante genética esté asociada con un estado de enfermedad, o que forme parte de la variación genética natural dentro de la población. Esta técnica aprovecha dos grandes recursos genéticos, mutaciones asociadas a enfermedades, disponibles en la literatura, o en el dominio público con estudios de exoma y genoma basados en la población, que identifican la varianza genética rara. Para identificar un gen específico y empalme isoform forma de interés, abra la página de inicio de Ensembl y, seleccione la especie en el menú desplegable.
Introduzca el acrónimo del gen de interés y haga clic en Ir. Seleccione los enlaces correspondientes al gen de interés y el interés transcriptivo, y el ID de interés de la tabla Transcripción. Tenga en cuenta la transcripción de la transcripción específica de la transcripción del ARN y el producto proteico de los números de identificación de la transcripción de ARN en la columna de secuencia de referencia de la tabla de transcripción para futuras referencias.
Seleccione el enlace asociado con el producto proteico del número de identificación de transcripción de ARN para abrir una nueva página web desde el Centro Nacional de Información Biotecnológica, o BASE de datos de proteínas NCBI, y desplácese hacia abajo hasta la sección Origen para obtener la secuencia de proteínas primaria para la transcripción genética de interés. A continuación, desplácese hasta la sección Características para obtener una lista de las características de la proteína. Para calcular una frecuencia de alelo menor para cada posición de aminoácidos con una variante de control, abra una hoja de cálculo con capacidad gráfica y cree una columna de las posiciones de todas las variantes experimentales.
Elimine los textos de variante para dejar solo las posiciones de variante y ordene las variantes en valor ascendente para identificar qué posiciones tienen más de una variante asociada. Obtener la suma de todas las frecuencias de alelo menor para una posición dada, combinando la frecuencia de alelo menor para cada variante asociada a una posición dada, y calcular una frecuencia de alelo menor para cada posición de aminoácidos con una variante experimental. A continuación, cree una columna de posiciones de aminoácidos que tengan variantes experimentales y calcule la frecuencia de alelos menores de todas las variantes asociadas a esa posición para todas las posiciones de variante.
Para crear un promedio móvil de las frecuencias de alelo menor para las variantes experimentales y de control, cree una columna que contenga todas las posiciones de aminoácidos en el gen de interés, y agregue una frecuencia de alelo menor de cero para todas las posiciones que no tienen variantes para los conjuntos de datos experimentales y de control. Para crear un promedio móvil para cada columna de prevalencia experimental y de control, cree una columna que represente un promedio móvil de la frecuencia de alelo menor para los conjuntos de datos de control y experimentales, y en la columna de promedio móvil coloque el promedio de la frecuencia de alelo menor respectiva para las cinco posiciones de variante N terminal y terminal C a cada posición. Para calcular la frecuencia mínima de la cohorte, divida el alelo menor más bajo identificado por dos e introduzca este valor en cualquier celda con la frecuencia de alelo menor de control de cero.
Esto evitará dividir por cero, al calcular la relación señal-ruido. Para calcular la relación señal-ruido a nivel de aminoácidos, divida cada posición de aminoácidos de media móvil experimental por el promedio de balanceo de control respectivo y graficar esta relación frente a la posición del aminoácido. Identificar las ubicaciones de aminoácidos de consenso de dominios y características funcionales, o áreas de modificación posterior a la traducción de la proteína de interés, identificar las posiciones de aminoácidos asociadas con los dominios y características de proteínas y abrir la página web NCBI.
Introduzca el producto proteico de la transcripción de ARN de la proteína de interés en el campo de búsqueda e identifique los dominios y características de proteína conocidos, en Características. Identifique y anote el nombre de dominio y el tipo y las posiciones de aminoácidos y seleccione el enlace correspondiente a la entidad para visualizar la región en la secuencia primaria de proteína de interés. Cree una columna junto a la columna señal-ruido, de modo que se pueda hacer referencia a la columna de posición de aminoácidos e identifique las celdas correspondientes en el aspecto del terminal N o C de cada dominio y entidad.
Luego, coloque uno en cada celda, cree un gráfico con estos límites en el eje Y y la posición del aminoácido en el eje X y superponga este gráfico con el gráfico de señal a ruido. Para asignar posiciones de variantes individuales para la superposición de los gráficos de topología de relación señal-ruido y de dominio de proteína, cree una columna junto a la columna de entidad de dominio de modo que las filas de la columna correspondan a las posiciones de aminoácidos y coloque una en cada celda de la fila agregada, correspondiente a una posición que contenga una variante respectiva. A continuación, cree un gráfico con esta columna como el eje Y y las posiciones de aminoácidos en el eje X, y superponga este gráfico con los gráficos de topología de dominio de señal a ruido y proteína.
Aquí, se describe un resultado representativo para un análisis de señal a ruido a nivel de aminoácidos para el miembro Q de la subfamilia de canal de voltaje de potasio un gen. Se muestran variaciones raras identificadas en la cohorte de control, y la secuenciación exsoma completa identificada incidentalmente, y las variantes asociadas al caso del síndrome QT largo que se consideran susceptibles de enfermedad asociada. También se representan los análisis de señal a ruido que comparan la secuenciación general del exsome y la frecuencia de variante de cohorte de síndrome QT largo, normalizada con respecto a la frecuencia de variante de cohorte de control.
En este experimento, las variantes asociadas al síndrome QT largo demostraron altas relaciones señal-ruido en dominios correspondientes con el vertido de canal, el filtro de selectividad y el dominio de unión de unión de un dominio de unión de unión de un dominio de unión de la subfamilia de canal privado de voltaje de potasio. En comparación, las variantes identificadas incidentalmente en la cohorte de secuenciación general, no demostraron claramente regiones específicas de alta elevación de señal a ruido, lo que sugiere que estas variantes reflejan la variación genética de fondo. Esta metodología podría aplicarse para medir el peso diagnóstico de las variantes de importancia desconocida que surgen durante las pruebas genéticas clínicas.