A análise de sinal-ruído em nível de aminoácido fornece uma medida da probabilidade de que uma variante genética esteja associada a um estado da doença, ou faça parte da variação genética natural dentro da população. Essa técnica utiliza dois grandes recursos genéticos, mutações associadas a doenças, disponíveis na literatura, ou em domínio público com estudos de exsome e genomas de base populacional, que identificam rara variância genética. Para identificar um gene específico e emendar isoform de interesse, abra a página inicial do Ensembl e selecione a espécie no menu suspenso.
Digite a sigla para o gene de interesse e clique em ir. Selecione os links correspondentes ao gene de interesse e aos juros transcritivos e ao ID de interesse da tabela Transcrição. Observe a transcrição específica da transcrição do RNA e o produto proteico dos números de identificação da transcrição do RNA na coluna sequência de referência da tabela de transcrição para referência futura.
Selecione o link associado ao produto proteico do número de identificação de transcrição do RNA para abrir uma nova página do Centro Nacional de Informações de Biotecnologia, ou Banco de Dados de Proteínas NCBI, e role até a seção Origem para obter a sequência primária de proteína para a transcrição genética de interesse. Em seguida, role até a seção Características para obter uma lista dos recursos proteicos. Para calcular uma pequena frequência de alelo para cada posição de aminoácido com uma variante de controle, abra uma planilha capaz de gráficos e crie uma coluna das posições de todas as variantes experimentais.
Remova os textos variantes para deixar apenas as posições variantes e classificar as variantes em valor ascendente para identificar quais posições possuem mais de uma variante associada. Obtenha a soma de todas as frequências de alelo menores para uma determinada posição, combinando a frequência de alelo menor para cada variante associada a uma determinada posição, e calcule uma frequência de alelo menor para cada posição de aminoácido com uma variante experimental. Em seguida, crie uma coluna de posições de aminoácidos que tenham variantes experimentais, e calcule a menor frequência de alelo de todas as variantes associadas a essa posição para todas as posições variantes.
Para criar uma média de rolamento das frequências de alelo menores para as variantes experimentais e de controle, crie uma coluna contendo todas as posições de aminoácidos no gene de interesse, e adicione uma pequena frequência de alelo de zero para todas as posições que não possuem variantes tanto para o controle quanto para conjuntos de dados experimentais. Para criar uma média tração para cada coluna de prevalência experimental e de controle, crie uma coluna representando uma média rolling da frequência de alelo menor tanto para os conjuntos de dados de controle quanto para os experimentais, e na coluna média de rolamento coloque a média da respectiva frequência de alelo menor para as cinco posições variantes N terminal e terminal C para cada posição. Para calcular a frequência mínima da coorte, divida o menor alelo menor identificado por dois e digite esse valor em qualquer célula com a frequência de alelo menor de zero.
Isso evitará dividir por zero, ao calcular a relação sinal-ruído. Para calcular a relação sinal-ruído nível de aminoácido, divida cada posição de aminoácidos médio experimental rolando pela média de rolamento de controle respectivo, e gráfico esta razão versus a posição aminoácido. Para identificar os locais de consenso de aminoácidos de domínios e características funcionais, ou áreas de modificação pós-translacional da proteína de interesse, identificar as posições de aminoácidos associadas aos domínios e características proteicas e abrir a página web do NCBI.
Digite o produto proteico da transcrição de RNA da proteína de interesse no campo de busca, e identifique os domínios e características de proteínas conhecidos, sob Características. Identifique e observe o nome e o tipo de domínio e as posições do aminoácido e selecione o link correspondente ao recurso para visualizar a região na proteína da sequência primária de interesse. Crie uma coluna ao lado da coluna sinal-ruído, para que a coluna de posição aminoácido possa ser referenciada e identifique as células correspondentes no aspecto terminal N ou C de cada domínio e recurso.
Em seguida, coloque um em cada célula, crie um gráfico com esses limites no eixo y e na posição de aminoácido no eixo x e sobreponha este gráfico com o gráfico sinal-para-ruído. Para mapear posições de variantes individuais para sobreposição da relação sinal-ruído e gráficos de topologia de domínio proteico, crie uma coluna ao lado da coluna de características de domínio, tal que linhas na coluna, correspondam às posições de aminoácidos e coloque uma em cada célula na linha adicionada, correspondendo a uma posição contendo uma respectiva variante. Em seguida, crie um gráfico com esta coluna como o eixo y e as posições de aminoácidos no eixo x, e sobreponha este gráfico com os gráficos de topologia de domínio de sinal para ruído e proteína.
Aqui, um resultado representativo para uma análise de sinal-ruído nível de aminoácido para o canal de tensão de potássio fechado canal de subfamília Q membro um gene é retratado. Variância rara identificada na coorte de controle, e o experimental incidentalmente identificou sequenciamento exumeso saudável, e longas variantes associadas à síndrome de QT são mostradas. As análises de sinal a ruído comparando o sequenciamento exsumo total, e a longa frequência de variantes de coorte da síndrome QT, normalizada em relação à frequência da variante da coorte de controle, também estão representadas.
Neste experimento, as variantes associadas à síndrome QT longa demonstraram altas relações sinal-ruído em domínios correspondentes ao derramamento de canal, ao filtro de seletividade e ao canal de tensão de potássio subfamília E membro um domínio de ligação. Em comparação, as variantes identificadas incidentalmente na coorte de sequenciamento exum, não demonstraram claramente regiões específicas de alta elevação sinal-ruído, sugerindo que essas variantes refletem a variação genética de fundo. Essa metodologia poderia ser aplicada para medir o peso diagnóstico de variantes de significância desconhecida que surgem durante os testes genéticos clínicos.