L’analyse du signal au bruit au niveau des acides aminés fournit une mesure de la probabilité qu’une variante génétique soit associée à un état de maladie ou qu’elle fait partie de la variation génétique naturelle au sein de la population. Cette technique tire parti de deux grandes ressources génétiques, les mutations associées aux maladies, disponibles dans la littérature, ou dans le domaine public avec des études sur l’exsome et le génome basés sur la population, qui identifient la variance génétique rare. Pour identifier un gène spécifique et épisser l’isoforme d’intérêt, ouvrez la page d’accueil d’Ensembl et sélectionnez l’espèce dans le menu dropdown.
Entrez l’acronyme pour le gène d’intérêt, et cliquez sur aller. Sélectionnez les liens correspondant au gène d’intérêt et à l’intérêt transcriptif, ainsi que l’iD d’intérêt du tableau transcript. Notez la transcription spécifique de la transcription de l’ARN et le produit protéique des numéros d’identification de transcription de l’ARN dans la colonne de séquence de référence du tableau de transcription pour référence future.
Sélectionnez le lien associé au produit protéique du numéro d’identification de transcription de l’ARN pour ouvrir une nouvelle page Web du National Center for Biotechnology Information, ou NCBI Protein Database, et faites défiler vers la section Origine pour obtenir la séquence de protéines primaires pour la transcription génétique d’intérêt. Faites ensuite défiler jusqu’à la section Caractéristiques pour obtenir une liste des caractéristiques protéiques. Pour calculer une fréquence d’allèle mineure pour chaque position d’acide aminé avec une variante de contrôle, ouvrez une feuille de calcul capable de graphiquer et créez une colonne des positions de toutes les variantes expérimentales.
Supprimez les textes de variante pour ne laisser que les positions variantes et trier les variantes en valeur ascendante pour identifier les positions qui ont plus d’une variante associée. Obtenez la somme de toutes les fréquences d’allèles mineures pour une position donnée, en combinant la fréquence des allèles mineurs pour chaque variante associée à une position donnée, et calculez une fréquence d’allèle mineure pour chaque position d’acides aminés avec une variante expérimentale. Ensuite, créez une colonne de positions d’acides aminés qui ont des variantes expérimentales, et calculez la fréquence des allèles mineurs de toutes les variantes associées à cette position pour toutes les positions variantes.
Pour créer une moyenne de roulement des fréquences d’allèle mineures pour les variantes expérimentales et de contrôle, créez une colonne contenant toutes les positions d’acides aminés dans le gène d’intérêt, et ajoutez une fréquence d’allèle mineure de zéro pour toutes les positions qui n’ont pas de variantes pour les ensembles de données de contrôle et expérimentaux. Pour créer une moyenne de roulement pour chaque colonne de prévalence expérimentale et de contrôle, créez une colonne représentant une moyenne de roulement de la fréquence des allèles mineurs pour les ensembles de données de contrôle et expérimentaux, et dans la colonne moyenne roulante placez la moyenne de la fréquence des allèles mineurs respectifs pour les cinq positions variantes terminal N et terminal C à chaque position. Pour calculer la fréquence minimale de cohorte, divisez l’allèle mineur le plus bas identifié par deux et entrez cette valeur dans n’importe quelle cellule avec la fréquence des allèles mineurs de contrôle de zéro.
Cela évitera de se diviser par zéro, lors du calcul du rapport signal-bruit. Pour calculer le rapport signal-bruit de niveau d’acide aminé, divisez chaque moyenne expérimentale de roulement de position d’acide aminé par la moyenne de roulement de commande respective, et graphiquez ce rapport par rapport à la position d’acide aminé. Identifier les emplacements consensuels des acides aminés des domaines et des caractéristiques fonctionnels, ou les zones de modification post-translationnelle de la protéine d’intérêt, identifier les positions d’acides aminés associées aux domaines et fonctionnalités protéiques et ouvrir la page Web de l’INB.
Entrez le produit protéique de la transcription arn de la protéine d’intérêt dans le champ de recherche, et d’identifier les domaines de protéines connues et les caractéristiques, sous caractéristiques. Identifiez et notez le nom de domaine et le type ainsi que les positions des acides aminés et sélectionnez le lien correspondant à la fonctionnalité pour visualiser la région sur la séquence primaire de protéines d’intérêt. Créez une colonne à côté de la colonne signal-bruit, de sorte que la colonne de position en acides aminés peut être référencée, et identifiez les cellules correspondant à l’aspect terminal N ou C de chaque domaine et fonctionnalité.
Ensuite, placez-en un dans chaque cellule, créez un graphique avec ces limites sur l’axe Y et la position des acides aminés sur l’axe x et superposez ce graphique avec le graphique signal-bruit. Pour cartographier les positions des variantes individuelles pour la superposition du rapport signal/bruit et des graphiques de topologie du domaine protéique, créez une colonne à côté de la colonne de fonctionnalités de domaine de telle sorte que les lignes de la colonne correspondent aux positions d’acides aminés et placez-en une dans chaque cellule de la rangée ajoutée, correspondant à une position contenant une variante respective. Ensuite, créez un graphique avec cette colonne comme l’axe y et les positions d’acides aminés sur l’axe x, et superposez ce graphique avec les graphiques de topologie du domaine signal-bruit et protéines.
Ici, un résultat représentatif pour une analyse de signal-au-bruit de niveau d’acide aminé pour le canal fermé de tension de potassium sous-famille Q membre un gène est représenté. La variance rare identifiée dans la cohorte de contrôle, et le séquençage exsome entier identifié incidemment, et les variantes associées au syndrome de QT longues jugées susceptibles d’être la maladie associée sont montrées. Les analyses signal-bruit comparant le séquençage exsome entier, et la fréquence longue de variante de cohorte de syndrome de QT, normalisée contre la fréquence de variante de cohorte de contrôle, sont également représentées.
Dans cette expérience, les variantes associées au syndrome de QT long ont démontré des rapports signal-bruit élevés dans les domaines correspondant à la coulée de canal, au filtre de sélectivité, et au canal fermé de tension de potassium sous-famille E membre un domaine contraignant. En comparaison, incidemment identifié des variantes dans la cohorte exsome entière de séquençage, n’a pas clairement démontré des régions spécifiques de l’altitude élevée de signal-au-bruit, suggérant que ces variantes reflètent la variation génétique de fond. Cette méthodologie pourrait être appliquée pour évaluer le poids diagnostique des variantes d’importance inconnue qui surviennent lors des essais génétiques cliniques.