È necessario avere un abbonamento a JoVE per visualizzare questo. Accedi o inizia la tua prova gratuita.
Method Article
Questo protocollo illustra come esplorare, confrontare e interpretare i glicomi proteici umani con risorse online.
L'iniziativa Glyco@Expasy è stata lanciata come una raccolta di database e strumenti interdipendenti che coprono diversi aspetti della conoscenza della glicobiologia. In particolare, mira a evidenziare le interazioni tra glicoproteine (come i recettori della superficie cellulare) e proteine leganti i carboidrati mediate dai glicani. Qui, le principali risorse della collezione sono introdotte attraverso due esempi illustrativi centrati sull'N-glicoma dell'antigene prostatico specifico umano (PSA) e sull'O-glicoma delle proteine sieriche umane. Attraverso diverse query di database e con l'aiuto di strumenti di visualizzazione, questo articolo mostra come esplorare e confrontare il contenuto in un continuum per raccogliere e correlare informazioni altrimenti sparse. I dati raccolti sono destinati ad alimentare scenari più elaborati della funzione glicanica. La glicoinformatica qui introdotta è, quindi, proposta come mezzo per rafforzare, modellare o confutare le ipotesi sulla specificità di un glicoma proteico in un determinato contesto.
I glicani, le proteine a cui sono attaccati (glicoproteine) e le proteine a cui si legano (lectine o proteine leganti i carboidrati) sono i principali attori molecolari sulla superficie cellulare1. Nonostante questo ruolo centrale nella comunicazione cellula-cellula, gli studi su larga scala, compresi i dati glicemici, glicoproteomici o glicano-interamici sono ancora scarsi rispetto alla loro controparte in genomica e proteomica.
Fino a poco tempo fa, non erano stati sviluppati metodi per caratterizzare le strutture ramificate dei carboidrati complessi mentre erano ancora coniugati alla proteina vettore. La biosintesi delle glicoproteine è un processo non-template-driven in cui i donatori di monosaccaridi, i substrati glicoproteici accettanti e le glicosiltransferasi e le glicosidasi svolgono un ruolo interattivo. Le glicoproteine risultanti possono portare strutture complesse con più punti di ramificazione in cui ogni componente monosaccaride può essere uno dei diversi tipi presenti in natura1. Il processo non basato su modelli impone l'analisi biochimica come unica opzione per generare dati strutturali oligosaccaridi. Il processo analitico delle strutture glicaniche associate a una proteina nativa è spesso impegnativo in quanto richiede tecnologie sensibili, quantitative e robuste per determinare la composizione dei monosaccaridi, i collegamenti e le sequenze ramificate2.
In questo contesto, la spettrometria di massa (MS) è la tecnica più utilizzata negli esperimenti di glicomica e glicoproteomica. Con il passare del tempo, questi vengono eseguiti in impostazioni di throughput più elevate e i dati si accumulano ora nei database. Le strutture glicaniche in vari formati3, popolano GlyTouCan4, il repository universale di dati sul glicano in cui ogni struttura è associata a un identificatore stabile indipendentemente dal livello di precisione con cui il glicano è definito (ad esempio, possibile tipo di collegamento mancante o composizione ambigua). Vengono raccolte strutture molto simili, ma le loro piccole differenze sono chiaramente riportate. Le glicoproteine sono descritte e curate in GlyConnect5 e GlyGen6, due database che si incrociano a vicenda. I dati sulla SM a supporto di elementi strutturali di prova sono sempre più memorizzati in GlycoPOST7. Per una più ampia copertura delle risorse online, il capitolo 52 del manuale di riferimento, Essentials of Glycobiology, è dedicato alla glicoinformatica8. È interessante notare che il software di identificazione dei glicopeptidi è proliferato negli ultimi anni9,10 anche se non a vantaggio della riproducibilità. Quest'ultima preoccupazione ha spinto i leader della HUPO GlycoProteomics Initiative (HGI) a lanciare una sfida software nel 2019. I dati ms ottenuti dall'elaborazione di miscele complesse di proteine sieriche umane N- e O-glicosilate in modalità di frammentazione CID, ETD ed EThcD, sono stati messi a disposizione dei concorrenti, siano essi utenti di software o sviluppatori. Il rapporto completo sui risultati di questa sfida11 è solo delineato qui. Per cominciare, è stata osservata una diffusione di identificazioni. È stato principalmente interpretato come causato dalla diversità dei metodi implementati nei motori di ricerca, delle loro impostazioni e del modo in cui gli output sono stati filtrati e il peptide "contato". Il progetto sperimentale potrebbe anche aver messo alcuni software e approcci a un (dis)vantaggio. È importante sottolineare che i partecipanti che utilizzano lo stesso software hanno riportato risultati incoerenti, evidenziando così gravi problemi di riproducibilità. Si è concluso confrontando diversi contributi che alcune soluzioni software funzionano meglio di altre e alcune strategie di ricerca producono risultati migliori. È probabile che questo feedback guidi il miglioramento dei metodi automatizzati di analisi dei dati sui glicopeptidi e, a sua volta, avrà un impatto sul contenuto del database.
L'espansione della glicoinformatica ha portato alla creazione di portali web che forniscono informazioni e accesso a più risorse simili o complementari. I più recenti e aggiornati sono descritti in un capitolo della serie di libri Comprehensive Glycoscience12 e attraverso la cooperazione, una soluzione per la condivisione dei dati e lo scambio di informazioni è offerta in una modalità di accesso aperto. Uno di questi portali è stato sviluppato che è stato originariamente chiamato Glycomics@ExPASy 13 e ribattezzato Glyco@Expasy, a seguito della grande revisione della piattaforma Expasy14 che ha ospitato una vasta collezione di strumenti e database utilizzati in diversi -omics per decenni, l'elemento più popolare è UniProt15-la knowledge base proteica universale. Glyco@Expasy offre una scoperta didattica dello scopo e dell'utilizzo di database e strumenti, basata su una categorizzazione visiva e una visualizzazione delle loro interdipendenze. Il seguente protocollo illustra le procedure per esplorare i dati glicemici e glicoproteomici con una selezione di risorse da questo portale che rende esplicita la connessione tra glicoproteomica e glicano-interamitomica tramite glicomico. Così com'è, gli esperimenti glicemici producono strutture in cui i monosaccaridi sono completamente definiti e i collegamenti parzialmente o completamente determinati, ma il loro attaccamento al sito proteico è scarsamente, se non del tutto, caratterizzato. Al contrario, gli esperimenti di glicoproteomica generano informazioni precise sull'attaccamento al sito ma con una scarsa risoluzione delle strutture glicaniche, spesso limitata alle composizioni monosaccaridiche. Queste informazioni sono raggruppate nel database GlyConnect. Inoltre, gli strumenti di ricerca in GlyConnect possono essere utilizzati per rilevare potenziali ligandi glicani che sono descritti insieme alle proteine che li riconoscono in UniLectin16, collegato a GlyConnect tramite glicani. Il protocollo qui presentato è diviso in due sezioni per coprire domande specifiche per glicani e glicoproteine legati a N e O.
NOTA: è necessario un dispositivo con una connessione Internet (schermo più grande preferito) e un browser Web aggiornato come Chrome o Firefox. L'utilizzo di Safari o Edge potrebbe non essere altrettanto affidabile.
1. Da una proteina N-glicoma in GlyConnect a una lectina di UniLectin
2. Esplorare e confrontare gli O-glicomi in GlyConnect
La prima parte del protocollo (sezione 1) ha mostrato come indagare la specificità o la comunanza di N-glicani attaccati su Asn-69 dell'antigene prostatico specifico umano (PSA) utilizzando la piattaforma GlyConnect. Le variazioni dipendenti dai tessuti (urina e liquido seminale), così come le variazioni isoforme-dipendenti (normale e ad alto pI) nell'espressione del glicano, sono state enfatizzate utilizzando due strumenti di visualizzazione (Figura 4 e
GlyConnect Octopus come strumento per rivelare correlazioni inaspettate
GlyConnect Octopus è stato originariamente progettato per interrogare il database con una definizione libera di glicani. Infatti, la letteratura riporta spesso le principali caratteristiche dei glicani in un glicoma come essere fucosilati o sializzati, essere fatti di due o più antenne, ecc. Inoltre, i glicani, sia N- che O-linked, sono classificati in nuclei, come dettagliato nel manuale di riferimento Essentials of
Gli autori non dichiarano conflitti di interesse.
L'autore riconosce calorosamente i membri passati e presenti del Proteome Informatics Group coinvolti nello sviluppo delle risorse utilizzate in questo tutorial, in particolare, Julien Mariethoz e Catherine Hayes per GlyConnect, François Bonnardel per UniLectin, Davide Alocci e Frederic Nikitin per Octopus e Thibault Robin per Compozitor e tocco finale su Octopus.
Lo sviluppo del progetto glyco@Expasy è sostenuto dalla Confederazione attraverso la Segreteria di Stato per la formazione, la ricerca e l'innovazione (SEFRI) ed è attualmente integrato dal Fondo nazionale svizzero per la ricerca scientifica (FNS: 31003A_179249). ExPASy è gestito dall'Istituto Svizzero di Bioinformatica e ospitato presso il Vital-IT Competency Center. L'autore riconosce anche Anne Imberty per l'eccezionale cooperazione sulla piattaforma UniLectin sostenuta congiuntamente da ANR PIA Glyco@Alps (ANR-15-IDEX-02), Alliance Campus Rhodanien Co-funds (http://campusrhodanien.unige-cofunds.ch) Labex Arcane/CBH-EUR-GS (ANR-17-EURE-0003).
Name | Company | Catalog Number | Comments |
internet connection | user's choice | ||
recent version of web browser | user's choice |
Richiedi autorizzazione per utilizzare il testo o le figure di questo articolo JoVE
Richiedi AutorizzazioneThis article has been published
Video Coming Soon