Die Signal-Rausch-Analyse im Aminosäuren-Pegel liefert ein Maß für die Wahrscheinlichkeit, dass eine genetische Variante mit einem Krankheitszustand in Verbindung gebracht wird oder Teil der natürlichen genetischen Variation innerhalb der Population ist. Diese Technik nutzt zwei große genetische Ressourcen, krankheitsassoziierte Mutationen, die in der Literatur verfügbar sind, oder in der Öffentlichkeit mit populationsbasierten Exsome- und Genomstudien, die seltene genetische Varianz identifizieren. Um ein bestimmtes Gen und eine spleißende Isoform von Interesse zu identifizieren, öffnen Sie die Ensembl-Homepage und wählen Sie die Art aus dem Dropdown-Menü aus.
Geben Sie das Akronym für das Gen von Interesse ein, und klicken Sie auf "Gehen". Wählen Sie die Links aus, die dem Gen von Interesse und dem Transkriptionsinteresse entsprechen, sowie die ID von Interesse aus der Tabelle Transkript. Beachten Sie das Transkriptspezifische RNA-Transkript und das Proteinprodukt von RNA-Transkript-Identifikationsnummern in der Referenzsequenzspalte der Transkripttabelle für zukünftige Referenzen.
Wählen Sie den Link aus, der mit dem Proteinprodukt der RNA-Transkript-ID-Nummer verknüpft ist, um eine neue Webseite vom National Center for Biotechnology Information oder NCBI Protein Database zu öffnen, und scrollen Sie nach unten zum Abschnitt Ursprung, um die primäre Proteinsequenz für das gen-Transkript von Interesse zu erhalten. Scrollen Sie dann bis zum Abschnitt Features, um eine Liste der Proteinfeatures zu erhalten. Um eine kleine Allelfrequenz für jede Aminosäureposition mit einer Steuerungsvariante zu berechnen, öffnen Sie eine graphiumfähige Tabelle und erstellen Sie eine Spalte der Positionen aller experimentellen Varianten.
Entfernen Sie die Variantentexte, um nur die Variantenpositionen zu belassen, und sortieren Sie die Varianten im aufsteigenden Wert, um zu identifizieren, welche Positionen mehr als eine zugeordnete Variante aufweisen. Erhalten Sie die Summe aller kleineren Allelfrequenzen für eine bestimmte Position, indem Sie die kleine Allelfrequenz für jede Variante, die mit einer bestimmten Position verbunden ist, kombinieren, und berechnen Sie eine geringfügige Allelfrequenz für jede Aminosäureposition mit einer experimentellen Variante. Erstellen Sie als Nächstes eine Spalte mit Aminosäurepositionen mit experimentellen Varianten, und berechnen Sie die kleinere Allelhäufigkeit aller Varianten, die mit dieser Position verbunden sind, für alle Variantenpositionen.
Um einen gleitenden Durchschnitt der kleineren Allelfrequenzen sowohl für die experimentellen als auch für die Steuerungsvarianten zu erstellen, erstellen Sie eine Spalte, die alle Aminosäurepositionen im Gen von Interesse enthält, und fügen Sie eine kleine Allelfrequenz von Null für alle Positionen hinzu, die keine Varianten sowohl für die Kontroll- als auch für die experimentellen Datensätze haben. Um einen gleitenden Durchschnitt für jede experimentelle und Kontrollprävalenzspalte zu erstellen, erstellen Sie eine Spalte, die einen gleitenden Durchschnitt der kleinen Allelfrequenz sowohl für die Steuer- als auch für die experimentellen Datensätze darstellt, und platzieren Sie in der rollenden Durchschnittsspalte den Durchschnitt der jeweiligen nebenkleineren Allelfrequenz für die fünf Variantenpositionen N-Klemme und C-Klemme zu jeder Position. Um die Kohorten-Mindestfrequenz zu berechnen, dividieren Sie das niedrigste kleinere Allel, das durch zwei identifiziert wird, und geben Sie diesen Wert in eine beliebige Zelle mit der Kontroll-Moll-Allelfrequenz von Null ein.
Dadurch wird eine Teilung durch Null bei der Berechnung des Signal-Rausch-Verhältnisses vermieden. Um das Signal-Rausch-Verhältnis im Aminosäure-Pegel zu berechnen, dividieren Sie jede Aminosäureposition experimentellen Rolldurchschnitt durch den jeweiligen Kontrollwalzdurchschnitt, und grafisch dieses Verhältnis im Vergleich zur Aminosäureposition. Identifizieren Sie die Konsens-Aminosäure-Standorte von funktionellen Domänen und Merkmalen oder Bereiche der posttranslationalen Modifikation des Proteins von Interesse, identifizieren Sie die Aminosäurepositionen, die mit den Proteindomänen und -merkmalen verbunden sind, und öffnen Sie die NCBI-Webseite.
Geben Sie das Proteinprodukt der RNA-Transkription des von Interesse befindlichen Proteins in das Suchfeld ein und identifizieren Sie die bekannten Proteindomänen und -merkmale unter Features. Identifizieren und notieren Sie den Domänennamen und typ und die Aminosäurepositionen und wählen Sie den Link aus, der dem Feature entspricht, um die Region auf der primären Sequenz des Proteins von Interesse zu visualisieren. Erstellen Sie eine Spalte neben der Signal-Rausch-Spalte, damit auf die Aminosäurepositionsspalte verwiesen werden kann, und identifizieren Sie die Zellen, die am N- oder C-Terminalaspekt jeder Domäne und jedes Features entsprechen.
Platzieren Sie dann eine eine in jeder Zelle, erstellen Sie ein Diagramm mit diesen Grenzen auf der y-Achse und der Aminosäureposition auf der x-Achse und überlagern Sie dieses Diagramm mit dem Signal-Rausch-Diagramm. Um einzelne Variantenpositionen für die Überlagerung des Signal-Rausch-Verhältnisses und der Proteindomänentopologie-Diagramme zu zuordnen, erstellen Sie eine Spalte neben der Domänen-Feature-Spalte, sodass die Zeilen in der Spalte den Aminosäurepositionen entsprechen, und platzieren Sie eine Inzelle in jeder Zelle in der hinzugefügten Zeile, die einer Position entspricht, die eine entsprechende Variante enthält. Erstellen Sie dann ein Diagramm mit dieser Spalte als y-Achse und die Aminosäurepositionen auf der x-Achse, und überlagern Sie dieses Diagramm mit den Signal-Rausch- und Proteindomänentopologiediagrammen.
Hierwird wird ein repräsentatives Ergebnis für eine Aminosäure-Pegel-Signal-Rausch-Analyse für die Kaliumspannungs-Gated-Kanal-Unterfamilie Q-Mitglied ein Gen dargestellt. Seltene Varianz in der Kontrollkohorte identifiziert, und die experimentelle nebenbei identifiziert ganze exsome Sequenzierung, und lange QT-Syndrom Fall assoziierten Varianten als wahrscheinlich, um Krankheit verbunden sind gezeigt. Die Signal-Rausch-Analysen, die die gesamte Exsome-Sequenzierung vergleichen, und die lange QT-Syndrom-Kohorten-Variantenfrequenz, normalisiert gegen die Regelkohorten-Variantenfrequenz, werden ebenfalls dargestellt.
In diesem Experiment zeigten die langen QT-Syndrom-assoziierten Varianten hohe Signal-Rausch-Verhältnisse in Domänen, die dem Kanalguss, dem Selektivitätsfilter und der Kaliumspannungs-Gated-Kanal-Unterfamilie E-Mitglied eine Bindungsdomäne entsprechen. Im Vergleich dazu zeigten im Übrigen identifizierte Varianten in der gesamten Sequenzierungskohorte nicht eindeutig bestimmte Regionen mit hoher Signal-Rausch-Höhe, was darauf hindeutet, dass diese Varianten die genetische Nagenvariation im Hintergrund widerspiegeln. Diese Methode könnte angewendet werden, um das diagnostische Gewicht von Varianten von unbekannter Bedeutung zu messen, die während klinischer Gentests auftreten.