L'analisi segnale-rumore a livello di amminoacidi, fornisce una misura della probabilità che una variante genetica sia associata a uno stato di malattia, o sia parte della variazione genetica naturale all'interno della popolazione. Questa tecnica sfrutta due grandi risorse genetiche, mutazioni associate alle malattie, disponibili in letteratura, o di pubblico dominio con studi esome e genoma basati sulla popolazione, che identificano la rara varianza genetica. Per identificare un gene specifico e l'isoforma della giunzione di interesse, apri la homepage di Ensembl e seleziona la specie dal menu a discesa.
Immettere l'acronimo per il gene di interesse e fare clic su vai. Selezionare i collegamenti corrispondenti al gene di interesse e all'interesse trascrittivo e l'ID di interesse dalla tabella Trascrizione. Si noti la trascrizione specifica dell'RNA e il prodotto proteico dei numeri di identificazione della trascrizione dell'RNA nella colonna della sequenza di riferimento della tabella di trascrizione per riferimento futuro.
Selezionare il collegamento associato al prodotto proteico del numero ID trascrizione dell'RNA per aprire una nuova pagina web dal National Center for Biotechnology Information, o NCBI Protein Database, e scorrere verso il basso fino alla sezione Origin per ottenere la sequenza proteica primaria per la trascrizione genica di interesse. Quindi scorrere verso l'alto fino alla sezione Caratteristiche per ottenere un elenco delle caratteristiche proteiche. Per calcolare una frequenza allele minore per ogni posizione di amminoacido con una variante di controllo, aprire un foglio di calcolo capace di grafica e creare una colonna delle posizioni di tutte le varianti sperimentali.
Rimuovere i testi variante per lasciare solo le posizioni delle varianti e ordinare le varianti in valore crescente per identificare quali posizioni hanno più di una variante associata. Ottenere la somma di tutte le frequenze alleliche minori per una data posizione, combinando la frequenza allele minore per ogni variante associata a una data posizione, e calcolare una frequenza allele minore per ogni posizione di amminoacido con una variante sperimentale. Creare quindi una colonna di posizioni amminoacidiche con varianti sperimentali e calcolare la frequenza allele minore di tutte le varianti associate a tale posizione per tutte le posizioni variante.
Per creare una media mobile delle frequenze alleliche minori sia per le varianti sperimentali che per le varianti di controllo, creare una colonna contenente tutte le posizioni degli amminoacidi nel gene di interesse e aggiungere una minore frequenza allele di zero per tutte le posizioni che non hanno varianti sia per il controllo che per i set di dati sperimentali. Per creare una media mobile per ogni colonna di prevalenza sperimentale e di controllo, creare una colonna che rappresenti una media mobile della frequenza di allele minore sia per i set di dati di controllo che per i set di dati sperimentali, e nella colonna media di rotolamento posizionare la media della rispettiva frequenza allele minore per le cinque posizioni variante N terminale e terminale C in ogni posizione. Per calcolare la frequenza minima della coorte, dividere l'allele minore più basso identificato da due e immettere questo valore in qualsiasi cella con la frequenza dell'allele minore di controllo pari a zero.
Ciò eviterà di dividere per zero, quando si calcola il rapporto segnale-rumore. Per calcolare il rapporto segnale-rumore a livello di amminoacido, dividere ogni media di rotolamento sperimentale della posizione degli amminoacidi per la rispettiva media di rotolamento di controllo, e grafare questo rapporto rispetto alla posizione degli amminoacidi. Per identificare le posizioni degli amminoacidi di consenso di domini e caratteristiche funzionali, o aree di modifica post-traslazionale della proteina di interesse, identificare le posizioni degli amminoacidi associate ai domini e alle caratteristiche proteiche e aprire la pagina web ncbi.
Immettere il prodotto proteico della trascrizione dell'RNA della proteina di interesse nel campo di ricerca e identificare i domini e le caratteristiche proteiche noti, in Caratteristiche. Identificare e annotare il nome e il tipo di dominio e le posizioni degli amminoacidi e selezionare il collegamento corrispondente alla feature per visualizzare la regione sulla proteina di interesse sequenza primaria. Creare una colonna accanto alla colonna segnale-rumore, in modo che sia possibile fare riferimento alla colonna di posizione degli amminoacidi e identificare le celle corrispondenti all'aspetto terminale N o C di ogni dominio e funzionalità.
Quindi, posizionatene uno in ogni cella, create un grafico con questi limiti sull'asse y e la posizione degli amminoacidi sull'asse x e sovrapponete questo grafico con il grafico segnale-rumore. Per mappare le singole posizioni delle varianti per la sovrapposizione del rapporto segnale-rumore e dei grafici della topologia del dominio proteico, creare una colonna accanto alla colonna delle caratteristiche del dominio in modo che le righe nella colonna corrispondano alle posizioni degli amminoacidi e posizionarne una in ogni cella nella riga aggiunta, corrispondente a una posizione contenente una rispettiva variante. Quindi, create un grafico con questa colonna come asse y e le posizioni degli amminoacidi sull'asse x, e sovrapponite questo grafico con i grafici della topologia del dominio segnale-rumore e proteine.
Qui, viene descritto un risultato rappresentativo per un'analisi segnale-rumore a livello di amminoacido per la sottofamiglia del canale gated di tensione di potassio Q membro di un gene. Sono mostrate variazioni rare identificate nella coorte di controllo, e il sequenziamento esante sano identificato incidentalmente sperimentale, e varianti associate al caso della sindrome QT lunga ritenute probabilmente associate alla malattia. Sono rappresentate anche le analisi segnale-rumore che confrontano il sequenziamento sano esente, e la frequenza della variante della coorte della sindrome QT lunga, normalizzata rispetto alla frequenza della variante della coorte di controllo.
In questo esperimento, le varianti associate alla sindrome QT lunga hanno dimostrato alti rapporti segnale-rumore in domini corrispondenti al canale pour, al filtro di selettività e alla sottofamiglia di canale gated di tensione di potassio E membro un dominio di legame. In confronto, le varianti identificate incidentalmente nella sana coorte di sequenziamento, non hanno chiaramente dimostrato regioni specifiche di elevata elevazione segnale-rumore, suggerendo che queste varianti riflettono la variazione genetica di fondo. Questa metodologia potrebbe essere applicata per misurare il peso diagnostico di varianti di significato sconosciuto che sorgono durante i test genetici clinici.