Un abonnement à JoVE est nécessaire pour voir ce contenu. Connectez-vous ou commencez votre essai gratuit.
Method Article
Ici, nous présentons un protocole pour utiliser la dernière version de l’outil SeqAPASS (Sequence Alignment to Predict Across Species Susceptibility) de l’Environmental Protection Agency des États-Unis. Ce protocole démontre l’application de l’outil en ligne pour analyser rapidement la conservation des protéines et fournir des prédictions personnalisables et facilement interprétables de la sensibilité chimique entre les espèces.
L’outil SeqAPASS (Sequence Alignment to Predict Across Species Susceptibility) de l’Environmental Protection Agency des États-Unis est une application de dépistage en ligne rapide et gratuite qui permet aux chercheurs et aux organismes de réglementation d’extrapoler les informations sur la toxicité entre les espèces. Pour les cibles biologiques dans des systèmes modèles tels que les cellules humaines, les souris, les rats et les poissons-zèbres, des données sur la toxicité sont disponibles pour une variété de produits chimiques. Grâce à l’évaluation de la conservation des cibles protéiques, cet outil peut être utilisé pour extrapoler les données générées par ces systèmes modèles à des milliers d’autres espèces dépourvues de données de toxicité, ce qui donne des prédictions de la susceptibilité chimique intrinsèque relative. Les dernières versions de l’outil (versions 2.0-6.1) ont incorporé de nouvelles fonctionnalités qui permettent la synthèse, l’interprétation et l’utilisation rapides des données pour la publication et des graphiques de qualité présentation.
Parmi ces fonctionnalités figurent des visualisations de données personnalisables et un rapport de synthèse complet conçu pour résumer les données SeqAPASS pour faciliter l’interprétation. Cet article décrit le protocole pour guider les utilisateurs dans la soumission des tâches, la navigation dans les différents niveaux de comparaison des séquences de protéines, et l’interprétation et l’affichage des données résultantes. Les nouvelles fonctionnalités de SeqAPASS v2.0-6.0 sont mises en évidence. En outre, deux cas d’utilisation axés sur la conservation de la transthyrétine et des protéines des récepteurs opioïdes à l’aide de cet outil sont décrits. Enfin, les forces et les limites de SeqAPASS sont discutées pour définir le domaine d’applicabilité de l’outil et mettre en évidence différentes applications pour l’extrapolation inter-espèces.
Traditionnellement, le domaine de la toxicologie s’est fortement appuyé sur l’utilisation d’essais sur des animaux entiers pour fournir les données nécessaires aux évaluations de la sécurité chimique. Ces méthodes sont généralement coûteuses et gourmandes en ressources. Toutefois, en raison du grand nombre de produits chimiques actuellement utilisés et du rythme rapide auquel de nouveaux produits chimiques sont mis au point, il est reconnu à l’échelle mondiale qu’il existe un besoin de méthodes plus efficaces de dépistage des produits chimiques 1,2. Ce besoin et le changement de paradigme qui en a résulté pour s’éloigner de l’expérimentation animale ont conduit au développement de nombreuses nouvelles méthodes d’approche, y compris les tests de criblage à haut débit, la transcriptomique à haut débit, le séquençage de nouvelle génération et la modélisation informatique, qui sont des stratégies de test alternativesprometteuses 3,4.
L’évaluation de la sécurité chimique dans la diversité des espèces potentiellement touchées par les expositions chimiques a été un défi permanent, non seulement avec les tests de toxicité traditionnels, mais aussi avec les nouvelles méthodes d’approche. Les progrès de la toxicologie comparative et prédictive ont fourni des cadres pour comprendre la sensibilité relative de différentes espèces, et les progrès technologiques dans les méthodes de calcul continuent d’accroître l’applicabilité de ces méthodes. Plusieurs stratégies ont été discutées au cours de la dernière décennie qui tirent parti des bases de données existantes sur les séquences de gènes et de protéines, ainsi que de la connaissance de cibles moléculaires chimiques spécifiques, pour soutenir les approches prédictives pour l’extrapolation interspécifique et améliorer les évaluations de l’innocuité chimique au-delà des organismes modèles typiques 5,6,7,8.
Pour faire progresser la science dans l’action, s’appuyer sur ces études fondamentales en toxicologie prédictive, prioriser les efforts d’essais chimiques et soutenir la prise de décision, l’outil SeqAPASS (Sequence Alignment to Predict Across Species Susceptibility) de l’Environmental Protection Agency des États-Unis a été créé. Cet outil est une application Web publique et gratuite qui utilise des dépôts publics d’informations sur les séquences de protéines en constante expansion pour prédire la susceptibilité chimique à travers la diversité des espèces9. Basé sur le principe selon lequel la susceptibilité intrinsèque relative d’une espèce à un produit chimique particulier peut être déterminée en évaluant la conservation des cibles protéiques connues de ce produit chimique, cet outil compare rapidement les séquences d’acides aminés protéiques d’une espèce ayant une sensibilité connue à toutes les espèces avec des données de séquence protéique existantes. Cette évaluation est complétée par trois niveaux d’analyse, y compris (1) la séquence d’acides aminés primaires, (2) le domaine fonctionnel et (3) les comparaisons de résidus d’acides aminés critiques, chacune nécessitant une connaissance plus approfondie de l’interaction chimique-protéine et fournissant une plus grande résolution taxonomique dans la prédiction de la susceptibilité. L’une des principales forces de SeqAPASS est que les utilisateurs peuvent personnaliser et affiner leur évaluation en ajoutant des sources de données supplémentaires pour la conservation des cibles en fonction de la quantité d’informations disponibles concernant l’interaction chimique-protéine ou protéine-protéine d’intérêt.
La première version a été publiée en 2016, ce qui a permis aux utilisateurs d’évaluer les séquences d’acides aminés primaires et les domaines fonctionnels de manière rationalisée pour prédire la sensibilité chimique et contenait des capacités minimales de visualisation des données (tableau 1). Il a été démontré que les différences individuelles d’acides aminés sont des déterminants importants des différences entre les espèces dans les interactions chimique-protéine, ce qui peut affecter la susceptibilité chimiquedes espèces 10,11,12. Par conséquent, des versions ultérieures ont été développées pour prendre en compte les acides aminés critiques qui sont importants pour l’interaction chimique directe13. En réponse aux commentaires des intervenants et des utilisateurs, cet outil a fait l’objet d’une version annuelle avec de nouvelles fonctionnalités supplémentaires conçues pour répondre aux besoins des chercheurs et des organismes de réglementation en matière de résolution des problèmes liés à l’extrapolation interspécifique (tableau 1). Le lancement de la version 5.0 de SeqAPASS en 2020 a apporté des fonctionnalités centrées sur l’utilisateur qui intègrent des options de visualisation et de synthèse des données, des liens externes, des options de tableau récapitulatif et de rapport, ainsi que des fonctionnalités graphiques. Dans l’ensemble, les nouveaux attributs et capacités de cette version ont amélioré la synthèse des données, l’interopérabilité entre les bases de données externes et la facilité d’interprétation des données pour les prédictions de la sensibilité interspécifique.
1. Mise en route
REMARQUE: Le protocole présenté ici est axé sur l’utilitaire de l’outil et les fonctionnalités clés. Des descriptions détaillées des méthodes, des caractéristiques et des composants sont disponibles sur le site Web dans un guide de l’utilisateur complet (tableau 1).
Tableau 1 : Évolution de l’outil SeqAPASS. Liste des fonctionnalités et mises à jour ajoutées à l’outil SeqAPASS depuis son déploiement initial. Abréviations : SeqAPASS = alignement des séquences pour prédire la sensibilité de l’espèce à l’ensemble des espèces; ECOTOX = base de connaissances ECOTOXicology. Veuillez cliquer ici pour télécharger ce tableau.
Figure 1: Formulation du problème SeqAPASS: schéma des informations préliminaires nécessaires à une analyse réussie. Abréviations : SeqAPASS = alignement des séquences pour prédire la sensibilité de l’espèce à l’ensemble des espèces; LBD = domaine de liaison au ligand. Veuillez cliquer ici pour voir une version agrandie de cette figure.
Figure 2 : Interopérabilité SeqAPASS entre les bases de données. Diagramme schématique des outils, bases de données et ressources externes intégrés dans SeqAPASS. Abréviations : SeqAPASS = alignement des séquences pour prédire la sensibilité de l’espèce à l’ensemble des espèces; POA = voie de résultat indésirable; NCBI = Centre national d’information sur la biotechnologie; ECOTOX = base de connaissances ECOTOXicology. Veuillez cliquer ici pour voir une version agrandie de cette figure.
Tableau 2 : Liens, ressources et outils intégrés dans l’outil SeqAPASS. Une liste des différentes sources de données, liens et ressources exploités dans l’outil SeqAPASS. Abréviation : SeqAPASS = alignement de séquence pour prédire la sensibilité de l’espèce. Veuillez cliquer ici pour télécharger ce tableau.
2. Développement et exécution d’une requête SeqAPASS : Niveau 1
REMARQUE: Dans une analyse de niveau 1, toute la séquence d’acides aminés primaires d’une protéine de requête est comparée aux séquences d’acides aminés primaires de toutes les espèces avec des informations de séquence disponibles. Cet outil utilise des algorithmes pour exploiter, collecter et compiler des données accessibles au public afin d’aligner et de comparer rapidement les séquences d’acides aminés entre les espèces. Le backend stocke des informations provenant des bases de données du National Center for Biotechnology Information (NCBI) et utilise stratégiquement les versions autonomes de l’outil de recherche d’alignement local de base des protéines (BLASTp)54 et de l’outil d’alignement multiple basé sur les contraintes (COBALT)55.
3. Développement et exécution d’une requête SeqAPASS : Niveau 2
REMARQUE : Comme la séquence protéique entière n’est pas directement impliquée dans une interaction chimique, une analyse de niveau 2 compare uniquement la séquence d’acides aminés du domaine fonctionnel pour faire des prédictions de sensibilité aux rangs taxonomiques inférieurs (p. ex., classe, ordre, famille).
4. Accès et compréhension des données : SeqAPASS Niveau 1 et Niveau 2
5. Manipulation des paramètres de données : SeqAPASS Niveau 1 et Niveau 2
REMARQUE : Dans les analyses de niveau 1 et de niveau 2, on suppose que plus la similitude protéique est grande, plus il est probable qu’un produit chimique interagisse avec la protéine de la même manière que l’espèce ou la protéine interrogée, ce qui les rend vulnérables aux impacts potentiels des produits chimiques avec cette cible moléculaire. En raison de la similitude de ces données, les étapes de compréhension des données de niveaux 1 et 2 sont décrites ensemble dans un seul protocole.
6. Visualisation des données : SeqAPASS Niveau 1 et Niveau 2
7. Élaboration et exécution d’une analyse SeqAPASS : Niveau 3
REMARQUE : Une analyse de niveau 3 évalue les résidus d’acides aminés identifiés par l’utilisateur dans la protéine de requête et compare rapidement la conservation de ces résidus entre les espèces. On présume que les espèces dans lesquelles ces résidus sont conservés sont plus susceptibles d’interagir avec un produit chimique d’une manière similaire à l’espèce/protéine modèle. Comme le niveau 3 se concentre sur les acides aminés individuels, une analyse ne peut être effectuée que lorsque des connaissances détaillées sur les résidus d’acides aminés essentiels à l’interaction chimique-protéine ou protéine-protéine sont disponibles.
8. Identifier les résidus d’acides aminés critiques à l’aide de la littérature identifiée
9. Visualisation des données SeqAPASS de niveau 3
REMARQUE : Comme dans les niveaux précédents, les rapports principal et complet sont disponibles. En plus des données identiques aux données des niveaux 1 et 2, le rapport principal affiche les positions des acides aminés, les abréviations et une susceptibilité oui/non (O/N) similaire à celle du modèle de prédiction. De même, le rapport complet contient des informations sur la classification de la chaîne latérale des acides aminés et le poids moléculaire.
10. Interprétation des résultats de SeqAPASS : Sources de données pour la conservation des protéines
REMARQUE : Pour faciliter l’interprétation, cet outil comprend un rapport sommaire de décision (rapport DS) conçu pour intégrer les données entre les niveaux. Le rapport DS contient les résultats (c.-à-d. tableaux de données et/ou visualisations) que l’utilisateur a sélectionnés et permet d’évaluer rapidement les prévisions de sensibilité à plusieurs niveaux pour plusieurs espèces simultanément.
Pour démontrer l’application de l’outil SeqAPASS et mettre en évidence de nouvelles fonctionnalités, deux études de cas sont décrites représentant des cas dans lesquels la conservation des protéines prédit qu’il existe des différences de sensibilité chimique entre les espèces (transthyrétine humaine) et qu’il n’y a pas de différences (μ récepteur opioïde [MOR]). Le premier de ces exemples porte sur les comparaisons de séquences protéiques et de structures pour prédire le domaine d’applicabi...
Il est largement reconnu qu’il n’est pas possible de tester empiriquement suffisamment d’espèces pour saisir la diversité génomique, phénotypique, physiologique et comportementale des organismes vivants susceptibles d’être exposés à des produits chimiques d’intérêt toxicologique. L’objectif de SeqAPASS est de maximiser l’utilisation des données existantes et en expansion continue de la séquence protéique et des données structurelles pour aider et informer l’extrapolation des données / connai...
Les auteurs n’ont aucun conflit d’intérêts à divulguer.
Les auteurs remercient le Dr Daniel L. Villeneuve (U.S. EPA, Center for Computational Toxicology and Exposure) et le Dr Jon A. Doering (Department of Environmental Sciences, Louisiana State University) d’avoir fourni des commentaires sur une version antérieure du manuscrit. Ce travail a été soutenu par l’Environmental Protection Agency des États-Unis. Les opinions exprimées dans le présent document sont celles des auteurs et ne reflètent pas nécessairement les opinions ou les politiques de l’Environmental Protection Agency des États-Unis, et la mention de noms commerciaux ou de produits commerciaux n’indique pas non plus l’approbation du gouvernement fédéral.
Name | Company | Catalog Number | Comments |
Spreadsheet program | N/A | N/A | Any program that can be used to view and work with csv files (e.g. Microsoft Excel, OpenOffice Calc, Google Docs) can be used to access data export files. |
Basic computing setup and internet access | N/A | N/A | SeqAPASS is a free, online tool that can be easily used via an internet connection. No software downloads are required. |
Demande d’autorisation pour utiliser le texte ou les figures de cet article JoVE
Demande d’autorisationThis article has been published
Video Coming Soon