La bioformatique consiste à utiliser des ordinateurs pour résoudre des questions en biologie. La glycoinformatique consiste à utiliser des ordinateurs pour résoudre des questions en glycobiologie. Avec la glycoinformatique, nous développons des bases de données qui stockent des données glycomiques ou glycoprotéomiques qui peuvent être parcourues ou recherchées, et nous développons également des outils pour visualiser et comparer ces données.
Le rôle des glycanes est de plus en plus reconnu comme étant important dans la santé et la maladie, et la glycoinformatique essaie également de le faire valoir. Catherine Hayes est formée en glycobiologie et travaille comme data scientist. Julien Mariethoz est formé en informatique et coordonne les développements de bases de données et d’outils.
Rendez-vous sur le site glycoproteome.expasy. org/glycomics-expasy et dans le menu le plus à gauche, cochez la case glycoprotéines. Le graphique à bulles à droite zoomera dans la bulle correspondant à cette catégorie, puis cliquera sur la bulle GlyConnect pour ouvrir la page d’accueil de GlyConnect dans un nouvel onglet.
Sélectionnez le bouton protéine et dans la page d’affichage des protéines, tapez prostate dans la fenêtre de recherche. Cliquez sur 790 correspondant à l’isoforme commune de l’antigène prostatique spécifique ou PSA. Ensuite, dans la barre multicolore supérieure, cliquez sur le bouton source en vert pour afficher les types d’échantillons à partir desquels les données publiées ont été traitées.
Cliquez sur le bouton maladie pour vérifier le contenu de la base de données relatif à la santé. Cliquez ensuite sur le bouton structure pour afficher la liste complète des 135 structures associées au PSA à partir des données glycomiques. Cliquez sur le bouton de composition pour les 78 compositions associées déterminées par des expériences de glycoprotéomique.
Cliquez sur n’importe quelle structure ou composition pour obtenir plus de détails. Pour réduire l’ambiguïté des compositions, cliquez sur la structure suggérée sous une composition sélectionnée. Une suggestion est faite chaque fois que le nombre de monosaccharides coïncide avec celui d’une structure répertoriée.
Pour explorer pleinement la page des protéines, consultez plus de détails sur le côté droit de la page. Rendez-vous sur la page d’accueil d’Octopus pour confirmer la présence de traits structurels communs dans la diversité des glycanes attachés au PSA, gardez l’onglet N-Linked sélectionné par défaut, passez au sous-onglet cores et cliquez sur l’icône hybride. Ensuite, accédez au sous-onglet Propriétés, sélectionnez l’icône sialylée et cliquez sur le bouton de recherche vert.
Dans le graphique des relations affiché, survolez H6N4F1S1 pour mettre en évidence les liens avec sept protéines dans trois structures. Comparez cela en survolant H6N4F2S1 qui distingue les deux isoformes de PSA. Passez le curseur de la souris sur l’ID de la structure pour afficher sa représentation SNFG et cliquez dessus pour ouvrir la page correspondante.
Remplacez les nœuds centraux par des tissus, puis placez le curseur sur l’urine ou le liquide séminal au milieu du graphique pour afficher différentes associations. Changez les ganglions centraux en maladie pour afficher 13 options, dont l’une est le cancer de la prostate. La seule protéine associée est le PSA.
Ensuite, cliquez sur le bouton effacer pour actualiser la recherche. Accédez au sous-onglet Propriétés et cliquez sur l’icône bi-antennes. Ensuite, passez au sous-onglet Déterminants, sélectionnez l’icône de type deux 3-sialyl-LN et cliquez sur le bouton de recherche vert.
Vérifiez les associations récupérées par Octopus avec des glycanes bi-antennes contenant un motif terminal de type 3-sialyl-LN. Changez les nœuds centraux en tissus pour faciliter la lecture et survolez KLK3_human pour connecter directement le liquide séminal avec l’isoforme commune PSA et sept structures. Revenez à la page des protéines, en l’occurrence le PSA, pour effectuer l’analyse des relations potentielles entre chaque composition dans une liste de celles-ci.
Sur le côté droit de la page d’entrée PSA, cliquez sur le lien Compozitor. Assurez-vous que les champs de recherche Compozitor sont pré-remplis avec les détails de l’entrée ID 790 dans l’onglet protéine. Cliquez sur le bouton Ajouter à la sélection pour récupérer les données de la base de données.
Désélectionnez l’option Inclure les nœuds virtuels, puis cliquez sur le bouton du graphique de calcul pour afficher un graphique montrant un ensemble bien connecté de 78 compositions représentant le N-glycome PSA et un graphique à barres montrant les principales caractéristiques des glycanes. Restez dans l’onglet principal des protéines et sélectionnez l’antigène prostatique à haute forme Pi spécifique de la prostate dans le champ protéique. Cliquez sur le bouton Ajouter à la sélection pour récupérer des données de la base de données qui s’élève à 57 compositions.
Cliquez sur le bouton calculer le graphique pour générer les graphiques superposés des deux isoformes et évaluer les différences de glycomes des deux isoformes PSA. Rendez-vous sur le site www.unilectin. eu et cliquez sur le bouton UniLectin3D.
Cliquez sur le bouton de recherche de glycane, puis cliquez sur le diamant violet représentant un acide sialique qui invite à l’affichage de tous les motifs de liaison au glycane se terminant par un acide sialique stocké dans la base de données. Cliquez sur le motif 3-sialyl-LN de type deux pour demander l’affichage de toutes les lectines pour lesquelles une structure 3D confirmant l’interaction avec le 3-sialyl-LN de type deux est connue. Option de recherche par champ.
Dans le domaine des espèces, tapez Homo sapiens. Cliquez sur le bouton Explorer les structures à rayons X pour filtrer la liste d’origine. Il ne reste qu’une seule entrée, c’est la galectine-8 humaine.
Cliquez sur le bouton Afficher la structure 3D et les informations pour afficher des informations détaillées sur la galectine-8 humaine interagissant avec le 3-sialyl-LN de type deux. Accédez aux informations structurelles sur la galectine-8 humaine affichées sur la page avec deux visionneuses différentes. Tenez la souris pour retourner la molécule et mettre le ligand au premier plan avec le logiciel LiteMol.
Passez la souris sur les interactions répertoriées à gauche pour mettre à jour la vue à droite et localiser où cette interaction particulière agit dans la structure avec le logiciel PLIP. Parcourez le jeu de données HGI depuis la page d’accueil de GlyConnect en accédant directement à l’article référencé sur cette page. Cliquez sur le lien Compozitor sur le côté droit de la page d’entrée de référence pour évaluer la cohérence de l’ensemble de données.
Le champ de recherche sera déjà rempli avec une référence égale au numéro DOI dans l’onglet avancé de l’outil. Tapez glycan_type=O-linked après le numéro DOI pour affiner la recherche sur les glycanes liés à O. Cliquez ensuite sur le bouton Ajouter à la sélection pour récupérer les données de la base de données.
Gardez l’option Inclure les nœuds virtuels sélectionnée et cliquez sur le bouton calculer le graphique pour afficher le graphique des compositions connectées. Allez dans l’onglet protéines de GlyConnect Compozitor et dans la liste des protéines, sélectionnez l’inhibiteur inter-alpha de la trypsine chaîne lourde H4. Assurez-vous que la sélection de l’espèce est Homo sapiens par défaut. Désélectionnez N-Linked dans le type de glycane.
Sélectionnez uniquement THR 725 dans la liste des sites et cliquez sur le bouton Ajouter à la sélection. Cliquez ensuite sur le bouton calculer le graphique pour afficher le graphique des compositions connectées. Pour donner un sens aux nœuds virtuels, cliquez sur le bouton d’exportation sous le graphique.
Sélectionnez uniquement virtuel et cliquez sur l’icône du presse-papiers pour copier la sélection de huit compositions. Collez la sélection dans la fenêtre de requête de l’onglet personnalisé de Compozitor. Définissez l’étiquette de sélection dans le champ Compositions, sélectionnez O-Linked dans le champ type de glycane et cliquez sur le bouton Ajouter à la sélection.
Enfin, cliquez sur le bouton calculer le graphique. Les associations tissulaires dépendantes entre les protéines et les glycanes sont montrées dans cette sortie de GlyConnect Octopus. Toutes les protéines humaines portant des structures de glycane hybrides et sialylées avec les tissus dans lesquels elles sont exprimées sont affichées dans cette sortie.
Les associations avec l’urine sont mises en évidence montrant deux protéines, choriogonadotrophine ou GLHA humaine et PSA isoforme commune ou KLK3 humain, connectées aux structures glycanes dispersées. De même, les associations avec le liquide séminal sont mises en évidence montrant deux isoformes protéiques de PSA connectées aux structures de glycanes groupées. Les N-glycomes superposés des deux isoformes de PSA sont montrés dans la sortie de GlyConnect Compozitor.
Les nœuds bleus représentent les glycanes associés à l’isoforme commune et ceux de l’isoforme Pi élevée sont représentés sous forme de nœuds rouges. Le chevauchement entre les glycomes est représenté par des nœuds magenta. Les nombres à l’intérieur des nœuds représentent le nombre de structures de glycanes correspondant à la composition étiquetée en fonction du contenu de la base de données GlyConnect concernant le PSA.
Il a été démontré que le glycome PSA affiché dans GlyConnect était en corrélation avec la galectine-8 affichée dans UniLectin3D via l’épitope terminal 3-sialyl-LN de type deux. Cela fournit un scénario probable mais non garanti pour les interactions protéine-protéine médiées par les glycanes. Un ensemble de compositions d’O-glycane de haute qualité associées au sérum humain a été examiné et comparé au contenu de la base de données GlyConnect, offrant ainsi la possibilité de personnaliser un fichier de composition de glycane pour l’identification affinée des glycopeptides.
Il pourrait s’appuyer sur l’ensemble minimal de 20 compositions disponibles à partir d’un ensemble de données ou être amélioré avec 23 à 26 éléments collectés rationnellement dans GlyConnect pour renforcer la cohérence de l’ensemble. À partir de ce protocole, il est important de se rappeler qu’un glycome ne peut pas être limité à une liste d’éléments. Et que précisément avec les outils glycoinformatiques, vous pouvez montrer les dépendances entre ces éléments qui expliqueront finalement leur fonction.