JoVE Logo

Accedi

È necessario avere un abbonamento a JoVE per visualizzare questo. Accedi o inizia la tua prova gratuita.

In questo articolo

  • Riepilogo
  • Abstract
  • Introduzione
  • Protocollo
  • Risultati
  • Discussione
  • Divulgazioni
  • Riconoscimenti
  • Materiali
  • Riferimenti
  • Ristampe e Autorizzazioni

Riepilogo

Questo protocollo illustra come esplorare, confrontare e interpretare i glicomi proteici umani con risorse online.

Abstract

L'iniziativa Glyco@Expasy è stata lanciata come una raccolta di database e strumenti interdipendenti che coprono diversi aspetti della conoscenza della glicobiologia. In particolare, mira a evidenziare le interazioni tra glicoproteine (come i recettori della superficie cellulare) e proteine leganti i carboidrati mediate dai glicani. Qui, le principali risorse della collezione sono introdotte attraverso due esempi illustrativi centrati sull'N-glicoma dell'antigene prostatico specifico umano (PSA) e sull'O-glicoma delle proteine sieriche umane. Attraverso diverse query di database e con l'aiuto di strumenti di visualizzazione, questo articolo mostra come esplorare e confrontare il contenuto in un continuum per raccogliere e correlare informazioni altrimenti sparse. I dati raccolti sono destinati ad alimentare scenari più elaborati della funzione glicanica. La glicoinformatica qui introdotta è, quindi, proposta come mezzo per rafforzare, modellare o confutare le ipotesi sulla specificità di un glicoma proteico in un determinato contesto.

Introduzione

I glicani, le proteine a cui sono attaccati (glicoproteine) e le proteine a cui si legano (lectine o proteine leganti i carboidrati) sono i principali attori molecolari sulla superficie cellulare1. Nonostante questo ruolo centrale nella comunicazione cellula-cellula, gli studi su larga scala, compresi i dati glicemici, glicoproteomici o glicano-interamici sono ancora scarsi rispetto alla loro controparte in genomica e proteomica.

Fino a poco tempo fa, non erano stati sviluppati metodi per caratterizzare le strutture ramificate dei carboidrati complessi mentre erano ancora coniugati alla proteina vettore. La biosintesi delle glicoproteine è un processo non-template-driven in cui i donatori di monosaccaridi, i substrati glicoproteici accettanti e le glicosiltransferasi e le glicosidasi svolgono un ruolo interattivo. Le glicoproteine risultanti possono portare strutture complesse con più punti di ramificazione in cui ogni componente monosaccaride può essere uno dei diversi tipi presenti in natura1. Il processo non basato su modelli impone l'analisi biochimica come unica opzione per generare dati strutturali oligosaccaridi. Il processo analitico delle strutture glicaniche associate a una proteina nativa è spesso impegnativo in quanto richiede tecnologie sensibili, quantitative e robuste per determinare la composizione dei monosaccaridi, i collegamenti e le sequenze ramificate2.

In questo contesto, la spettrometria di massa (MS) è la tecnica più utilizzata negli esperimenti di glicomica e glicoproteomica. Con il passare del tempo, questi vengono eseguiti in impostazioni di throughput più elevate e i dati si accumulano ora nei database. Le strutture glicaniche in vari formati3, popolano GlyTouCan4, il repository universale di dati sul glicano in cui ogni struttura è associata a un identificatore stabile indipendentemente dal livello di precisione con cui il glicano è definito (ad esempio, possibile tipo di collegamento mancante o composizione ambigua). Vengono raccolte strutture molto simili, ma le loro piccole differenze sono chiaramente riportate. Le glicoproteine sono descritte e curate in GlyConnect5 e GlyGen6, due database che si incrociano a vicenda. I dati sulla SM a supporto di elementi strutturali di prova sono sempre più memorizzati in GlycoPOST7. Per una più ampia copertura delle risorse online, il capitolo 52 del manuale di riferimento, Essentials of Glycobiology, è dedicato alla glicoinformatica8. È interessante notare che il software di identificazione dei glicopeptidi è proliferato negli ultimi anni9,10 anche se non a vantaggio della riproducibilità. Quest'ultima preoccupazione ha spinto i leader della HUPO GlycoProteomics Initiative (HGI) a lanciare una sfida software nel 2019. I dati ms ottenuti dall'elaborazione di miscele complesse di proteine sieriche umane N- e O-glicosilate in modalità di frammentazione CID, ETD ed EThcD, sono stati messi a disposizione dei concorrenti, siano essi utenti di software o sviluppatori. Il rapporto completo sui risultati di questa sfida11 è solo delineato qui. Per cominciare, è stata osservata una diffusione di identificazioni. È stato principalmente interpretato come causato dalla diversità dei metodi implementati nei motori di ricerca, delle loro impostazioni e del modo in cui gli output sono stati filtrati e il peptide "contato". Il progetto sperimentale potrebbe anche aver messo alcuni software e approcci a un (dis)vantaggio. È importante sottolineare che i partecipanti che utilizzano lo stesso software hanno riportato risultati incoerenti, evidenziando così gravi problemi di riproducibilità. Si è concluso confrontando diversi contributi che alcune soluzioni software funzionano meglio di altre e alcune strategie di ricerca producono risultati migliori. È probabile che questo feedback guidi il miglioramento dei metodi automatizzati di analisi dei dati sui glicopeptidi e, a sua volta, avrà un impatto sul contenuto del database.

L'espansione della glicoinformatica ha portato alla creazione di portali web che forniscono informazioni e accesso a più risorse simili o complementari. I più recenti e aggiornati sono descritti in un capitolo della serie di libri Comprehensive Glycoscience12 e attraverso la cooperazione, una soluzione per la condivisione dei dati e lo scambio di informazioni è offerta in una modalità di accesso aperto. Uno di questi portali è stato sviluppato che è stato originariamente chiamato Glycomics@ExPASy 13 e ribattezzato Glyco@Expasy, a seguito della grande revisione della piattaforma Expasy14 che ha ospitato una vasta collezione di strumenti e database utilizzati in diversi -omics per decenni, l'elemento più popolare è UniProt15-la knowledge base proteica universale. Glyco@Expasy offre una scoperta didattica dello scopo e dell'utilizzo di database e strumenti, basata su una categorizzazione visiva e una visualizzazione delle loro interdipendenze. Il seguente protocollo illustra le procedure per esplorare i dati glicemici e glicoproteomici con una selezione di risorse da questo portale che rende esplicita la connessione tra glicoproteomica e glicano-interamitomica tramite glicomico. Così com'è, gli esperimenti glicemici producono strutture in cui i monosaccaridi sono completamente definiti e i collegamenti parzialmente o completamente determinati, ma il loro attaccamento al sito proteico è scarsamente, se non del tutto, caratterizzato. Al contrario, gli esperimenti di glicoproteomica generano informazioni precise sull'attaccamento al sito ma con una scarsa risoluzione delle strutture glicaniche, spesso limitata alle composizioni monosaccaridiche. Queste informazioni sono raggruppate nel database GlyConnect. Inoltre, gli strumenti di ricerca in GlyConnect possono essere utilizzati per rilevare potenziali ligandi glicani che sono descritti insieme alle proteine che li riconoscono in UniLectin16, collegato a GlyConnect tramite glicani. Il protocollo qui presentato è diviso in due sezioni per coprire domande specifiche per glicani e glicoproteine legati a N e O.

Protocollo

NOTA: è necessario un dispositivo con una connessione Internet (schermo più grande preferito) e un browser Web aggiornato come Chrome o Firefox. L'utilizzo di Safari o Edge potrebbe non essere altrettanto affidabile.

1. Da una proteina N-glicoma in GlyConnect a una lectina di UniLectin

  1. Accesso alle risorse da Glyco@Expasy
    NOTA: La procedura qui descritta è quella di accedere a GlyConnect ma può essere applicata all'accesso a qualsiasi risorsa registrata nella piattaforma.
    1. Vai a https://glycoproteome.expasy.org/glycomics-expasy e considera il grafico a bolle a destra che mostra diverse categorie come Glycoconjugates o Glycan Binding. Nel menu più a sinistra che riflette le categorie nelle bolle, seleziona la casella Glicoproteine in modo che il grafico a bolle a destra ingrandisca immediatamente la bolla corrispondente a quella categoria.
      NOTA: le bolle verdi sono strumenti e le bolle gialle sono database. Facendo clic su uno dei due si esegue nuovamente lo zoom avanti per fornire dettagli sulla risorsa. Prima di farlo, l'utente potrebbe voler comprendere le dipendenze di tale risorsa da altri.
    2. Per ottenere informazioni sulle dipendenze, passare dalla scheda Classificazione tematica delle risorse alla scheda Ruota delle dipendenze delle risorse . Posizionare il mouse su GlyConnect nella rotellina per verificarne il livello di integrazione con altre fonti (Figura 1).
    3. Torna alla scheda Classificazione tematica delle risorse per raggiungere la bolla GlyConnect come nel passaggio 1.1.1 e fai clic su di essa (Figura supplementare 1) per visualizzare la home page di GlyConnect in una nuova scheda che mostra le statistiche del contenuto nell'ultima versione del database.
      NOTA: una combinazione di colori dettagliata nella Tabella 1 corrisponde ai diversi tipi di informazioni memorizzate nel database. Questo codice colore è valido in tutte le pagine di entità in GlyConnect ed è coerente in tutto. La homepage mostra anche quattro sezioni dedicate a set di dati mirati come quelli che descrivono la glicosilazione della proteina spike Sars-Cov-2 (COVID-19) o che descrivono in dettaglio gli oligosaccaridi del latte umano (HMO). Questi non saranno esplorati in questo protocollo.
  2. Esplorare le informazioni contestuali di una proteina N-glicoma
    NOTA: tutte le strutture glicaniche in GlyConnect sono visualizzate in tre formati alternativi e comunemente usati: (1) Nomenclatura dei simboli per i glicani (SNFG)17 (2) IUPAC condensato18, e (3) Oxford19. Al contrario, non esiste una notazione standard per esprimere la composizione del glicano. In GlyConnect viene utilizzato il seguente codice: Hex per l'esoso, HexNAc per N-acetilesosamina, dHex per il fucoso e NeuAc per gli acidi sialici. Per semplicità, gli strumenti di visualizzazione si basano su una notazione condensata: H per l'esoso, N per N-acetilesosamina, F per il fucoso e S per gli acidi sialici. Inoltre, le lettere minuscole designano modifiche come "a" per l'acetilazione, "p" per la fosforilazione e "s" per la solfatazione, per il più frequente di questi cosiddetti sostituenti.
    1. Per visualizzare ed esplorare l'N-glicoma dell'antigene prostatico specifico umano (PSA), dalla homepage di GlyConnect, procedere come segue.
      NOTA: La glicosilazione del PSA umano è stata studiata nel corso degli anni, soprattutto nel contesto del cancro alla prostata. Il database GlyConnect memorizza tre riferimenti20,21,22, che combinano dati glicemici e glicoproteomici. Si noti che i risultati forniti qui sono stati ottenuti con la versione di settembre 2021 di GlyConnect. L'ulteriore utilizzo del database può produrre statistiche leggermente diverse a causa dei frequenti aggiornamenti dei dati.
    2. Selezionare il pulsante PROTEIN per aprire la vista proteina del database. Nella pagina di visualizzazione delle proteine, digitare prostata nella finestra di ricerca. Cercare le due voci elencate nell'output che distinguono due isoforme di PSA con valori pI distinti. Fare clic su 790 (colonna Id) corrispondente all'isoforma comune di PSA.
      NOTA: cercare la barra multicolore superiore che mostra le informazioni di riepilogo estratte dal lavoro pubblicato nello schema descritto sopra. Sono possibili diverse opzioni per la navigazione come descritto di seguito.
    3. Nella barra multicolore in alto, fare clic sul pulsante SOURCE in verde per visualizzare i tipi di campione da cui sono stati elaborati i dati pubblicati: Urina e Liquido seminale. Per sfogliare ulteriormente queste informazioni, fare clic su uno di questi tipi di esempio. Lo stesso vale per qualsiasi elemento che appare quando si fa clic su un pulsante colorato.
    4. Per controllare il contenuto relativo alla salute del database, fare clic sul pulsante MALATTIA , che contiene due elementi, uno dei quali è il cancro alla prostata che si collega alla corrispondente pagina dedicata alla malattia in GlyConnect. Il riassunto di quella pagina mostra che tre studi su larga scala hanno riportato 319 composizioni su 1.087 siti trovati in 308 proteine umane.
    5. Fare clic sul pulsante STRUTTURA per visualizzare l'elenco completo di 135 strutture associate a PSA dai dati glicemici. Fare clic sul pulsante COMPOSIZIONE per le 78 composizioni associate determinate da esperimenti di glicoproteomica. Clicca su qualsiasi struttura o composizione per ottenere ulteriori dettagli.
      NOTA: È possibile ottenere dettagli come l'elenco delle proteine alternative che trasportano la particolare struttura o l'elenco delle strutture corrispondenti alla composizione. PSA è noto per avere un solo sito di N-glicosilazione ad Asn-69 (solo un elemento conteggiato per il pulsante marrone SITE ).
    6. Per ridurre l'ambiguità delle composizioni, fare clic su SUGGEST STRUCT sotto una composizione selezionata (ad esempio, Hex:6 HexNAc:3 NeuAc:1). Un suggerimento viene fatto ogni volta che la conta dei monosaccaridi coincide con quella di una struttura sopra elencata (Figura 2).
      NOTA: La composizione Hex:6 HexNAc:3 NeuAc:1 generata da un esperimento di glicoproteomica è abbinata a quattro strutture a risoluzione più elevata dai dati glicemici. Nel caso del PSA, non vi è alcuna ambiguità del sito da risolvere poiché solo Asn-69 è glicosilato.
    7. Per esplorare completamente la pagina delle proteine, visualizzare ulteriori dettagli sul lato destro della pagina (Figura 3).
      1. Visualizza la voce predefinita 3QUM PDB (Protein Data Bank23) per PSA che viene mostrata con due glicani complessi attaccati a ciascun monomero (Figura 3) o la voce alternativa 2ZCK , che è disponibile anche a causa di un carboidrato collegato. La seconda voce mostra una singola catena.
        NOTA: Entrambe le voci sono visualizzate con il plugin 3D LiteMol24 che visualizza i glicani in notazione SNFG-3D adottata nel PDB-RCSB.
      2. Fare clic sui collegamenti corrispondenti di altri riferimenti incrociati per esplorare le informazioni funzionali rilevanti dai principali database di proteomica, come UniProt (Figura 3).
  3. Visualizzare e correlare le informazioni contestuali di una proteina N-glicoma
    NOTA: Come visto nella sezione precedente, lunghi elenchi di strutture o composizioni possono essere difficili da comprendere nel loro insieme e GlyConnect si basa su due diversi strumenti per visualizzare le informazioni chiave, vale a dire, GlyConnect Octopus e GlyConnect Compozitor (il primo espande le informazioni di riepilogo catturate in pulsanti colorati e il secondo fa emergere le dipendenze strutturali in termini di una struttura / composizione contenuta in un'altra). Come illustrato di seguito, GlyConnect Octopus esplora le associazioni tra le varie entità memorizzate nel database evidenziando connessioni multiple o singole come riflesso del contenuto del database.
    1. Eseguire una ricerca GlyConnect Octopus per confermare la presenza di tratti strutturali comuni come strutture del nucleo ibrido e strutture contenenti acido sialico altamente frequenti nella diversità dei glicani attaccati al PSA, come descritto di seguito.
    2. Vai alla homepage di Octopus https://glyconnect.expasy.org/octopus/. Mantenere selezionata la scheda collegata n per impostazione predefinita. Passare alla sottoscheda Core e fare clic sull'icona Ibrido . Passare alla sottoscheda Proprietà e fare clic sull'icona Sialylated . Fai clic sul pulsante verde Cerca qui sotto.
      NOTA: i risultati della ricerca vengono visualizzati graficamente come relazioni tra tre categorie di elementi. Per impostazione predefinita, l'elenco centrale corrisponde alla query per le composizioni, la raccolta di sinistra si estende sulle proteine correlate e quella di destra si estende sui glicani correlati.
    3. Nel grafico delle relazioni visualizzato, passare il puntatore del mouse su H6N4F1S1 per evidenziare i collegamenti a sei proteine e tre strutture. Confronta questo passando il mouse su H6N4F2S1 che individua le due isoforme di PSA (entrambe denominate UniProt ID: KLK3_HUMAN) e una struttura (ID: 10996). Passare il puntatore del mouse sull'ID della struttura per mostrare la sua rappresentazione SNFG e fare clic su di esso per aprire la pagina corrispondente (Figura supplementare 2).
    4. Cambia i nodi del polpo in qualsiasi altro argomento che descriva il contesto della glicosilazione. Il codice colore rimane lo stesso descritto in precedenza (vedere Tabella 1).
      1. Modificare i nodi centrali in Tessuti per visualizzare 15 opzioni al centro del grafico, molte delle quali sono fluidi corporei. Cerca tutte le associazioni tra proteine e glicani che corrispondono alla query a seconda delle informazioni sui tessuti. Posizionare il cursore su Urina o Liquido seminale al centro del grafico per visualizzare diverse associazioni (Figura 4A,B).
      2. Cambia i nodi centrali in Malattia per visualizzare 13 opzioni, una delle quali è il cancro alla prostata. L'unica proteina associata è il PSA (KLK3_HUMAN) (Figura supplementare 3).
        NOTA: Uno sguardo più da vicino al PSA N-glicoma mostrato nella pagina delle proteine individua l'altissima frequenza di un NeuAc terminale (a?-?) Gal(b?-?) Sottostruttura GlcNAc in molti casi su strutture con due o tre antenne. Un altro polpo può essere generato su questa base come descritto di seguito.
    5. Fare clic sul pulsante Cancella per aggiornare la ricerca. Passare alla sottoscheda Proprietà e fare clic sull'icona Bi-antennary . Passare alla sottoscheda Determinanti e fare clic sull'icona 3-Sialyl-LN (tipo 2 ). Fai clic sul pulsante verde Cerca qui sotto.
    6. Controllare le associazioni recuperate dal polpo con glicani bi-antennari contenenti un motivo terminale 3-Sialyl-LN (tipo 2), cioè NeuAc(a1-3)Gal(b1-4)GlcNAc. Cambia i nodi centrali in tessuti per una lettura più facile e passa il mouse su KLK3_HUMAN per collegare direttamente il liquido seminale con l'isoforma comune del PSA e sette strutture (Figura supplementare 4).
      NOTA: il secondo strumento di visualizzazione, GlyConnect Compozitor, esegue la scansione delle potenziali relazioni tra ogni composizione in un elenco di tali composizioni (vedere di seguito). Una relazione è definita come diversa da un solo monosaccaride tra due composizioni. Queste relazioni identificate tracciate in un grafico espongono la (dis)continuità di un glicoma.
    7. Utilizzare GlyConnect Compozitor per eseguire la scansione delle potenziali relazioni tra ogni composizione in un elenco di essi, come illustrato di seguito per il caso di PSA.
      NOTA: GlyConnect Compozitor elabora le composizioni in associazione con un contesto. Offre schede distinte per interrogare GlyConnect, ad esempio Proteine, Fonti, Linee cellulari, Malattie che sono autoesplicative per qualificare un contesto. Questo è illustrato qui con PSA come segue.
    8. Torna alla pagina delle proteine di PSA: https://glyconnect.expasy.org/browser/proteins/790. Sul lato destro della pagina di ingresso PSA, fare clic sul collegamento Compozitor. Assicurarsi che i campi di ricerca compozitor siano precompilati con i dettagli della voce Id 790 nella scheda Proteina (Proteina: antigene prostatico specifico, Specie: Homo sapiens e Tipo di glicano: N-linked).
    9. Fare clic sul pulsante Aggiungi alla selezione per recuperare i dati dal database e visualizzare il grafico delle composizioni collegate. Deselezionare l'opzione Includi nodi virtuali . Fare clic sul pulsante Calcola grafico per visualizzare un grafico che mostra un insieme ben collegato di 78 composizioni che rappresentano il PSA N-glicoma e un grafico a barre che mostra le principali caratteristiche dei glicani.
    10. Passa il mouse sopra la barra viola nel grafico a barre, che individua tutte le strutture sialylated nel grafico per rivelare una distorsione osservabile verso le strutture sialylated.
    11. Rimanere nella scheda Principale Proteina e selezionare Antigene prostatico specifico - isoforma Pi alta (psah) nel campo Proteina (nome).
      NOTA: i campi Glycan Type e Glycan Site vengono compilati automaticamente.
    12. Fare clic sul pulsante Aggiungi alla selezione per recuperare i dati dal database che ammontano a 57 composizioni. Fare clic sul pulsante Calcola grafico per generare i grafici sovrapposti di entrambe le isoforme e valutare le differenze nei glicomi delle due isoforme psa. Passare il puntatore del mouse sulle etichette dei nodi per richiedere la visualizzazione del numero di strutture corrispondenti alle composizioni/etichette (Figura 5).
  4. Informazioni sul legame con glicani in UniLectin
    NOTA: Ricordiamo il determinante testato nel polpo, descritto come NeuAc(a2-3)Gal(b1-4). Per definizione, è una parte legante stabilita di una struttura glicanica e, come tale, può essere ricercata nel database UniLectin3D25.
    1. Vai su https://www.unilectin.eu/ e fai clic sul pulsante UniLectin3D . In alternativa, vai direttamente alla pagina: https://www.unilectin.eu/unilectin3D/.Click sul pulsante Glycan Search per aprire questa pagina: https://www.unilectin.eu/unilectin3D/glycan_search (Figura supplementare 6).
    2. Fare clic sul diamante viola che rappresenta un acido sialico, che richiede la visualizzazione di tutti i motivi leganti il glicano che terminano con un acido sialico memorizzato nel database. La parte superiore di quella collezione di motivi contiene il motivo NeuAc(a2-3)Gal(b1-4)GlcNAc indagato in precedenza (Figura supplementare 7).
    3. Fare clic sul motivo NeuAc(a2-3)Gal(b1-4)GlcNAc per richiedere la visualizzazione di tutte le lectine per le quali è nota una struttura 3D che conferma l'interazione con NeuAc(a2-3)Gal(b1-4)GlcNAc. Il risultato per impostazione predefinita mostra le lectine in tutte le specie. Utilizzare l'opzione Cerca per campo per limitare la visualizzazione alle informazioni incentrate sull'uomo.
    4. Fare clic sull'opzione Cerca per campo . Nel campo delle specie , tipo Homo sapiens. Fare clic sul pulsante Esplora strutture a raggi X per filtrare l'elenco originale. Rimane solo una voce, cioè la galectina-8 umana. Fare clic sul pulsante Visualizza struttura e informazioni 3D nell'angolo in alto a destra dell'elemento elencato per visualizzare informazioni dettagliate sulla galectina-8 umana che interagisce con NeuAc(a2-3)Gal(b1-4)GlcNAc.
    5. Accedi alle informazioni strutturali sulla galectina-8 umana visualizzate sulla pagina con due diversi spettatori.
      1. Tenere premuto il mouse per ruotare la molecola e portare il ligando alla ribalta con il software Litemol26 integrato per mostrare la struttura 3D della lectina. Passa il mouse su una delle interazioni elencate a sinistra per aggiornare la vista a destra e individuare dove quella particolare interazione agisce nella struttura con il software PLIP27 integrato per dettagliare le interazioni atomiche tra la lectina e il ligando (Figura 6).
    6. Fare clic su qualsiasi pulsante verde che collega alle voci corrispondenti in UniProt, PDB (siti europei o americani) e GlyConnect per esplorare questi riferimenti incrociati.

2. Esplorare e confrontare gli O-glicomi in GlyConnect

  1. Esplorazione del set di dati ad alta affidabilità della sfida HGI
    NOTA: il set di dati HGI menzionato nell'introduzione è memorizzato nel database GlyConnect. Contiene 163 N- e 23 O-glicopeptidi trovati in 37 glicoproteine considerate come una lista ad alta confidenza. GlyConnect Compozitor28 è fondamentale per valutare la coerenza dei dati suglicomi. È importante sottolineare che Compozitor consente nodi virtuali (mostrati in grigio) quando è necessario un solo passaggio intermedio per connettere i nodi isolati. In questo modo, i nodi virtuali stringono il grafico e possono essere interpretati come strutture potenzialmente mancate nei risultati sperimentali.
    1. Sfoglia il set di dati HGI dalla homepage di GlyConnect andando direttamente alla pagina di riferimento dell'articolo: https://glyconnect.expasy.org/browser/references/2943.
      NOTA: Il riepilogo nei pulsanti colorati riflette parzialmente le cifre fornite nell'articolo. Tuttavia, se sono elencati solo 69 peptidi unici, ciò riflette molteplici associazioni tra peptidi e siti o strutture. Nell'articolo, un glicopeptide è definito come una combinazione unica di un peptide e una composizione. In GlyConnect, i glicositi vengono prima considerati e sono descritti come una combinazione di un peptide con strutture. Questo spiega la discrepanza nelle cifre tra GlyConnect e la citazione di cui sopra.
    2. Controllare l'alta frequenza di occorrenza di composizioni legate a N, come Hex:5 HexNAc:4 NeuAc:2, identificate su 42 siti in 43 peptidi rispetto alla frequente unicità della maggior parte delle composizioni O-linked identificate su 1 sito in 1 peptide.
    3. Fare clic sul collegamento Compozitor sul lato destro della pagina di immissione di riferimento per valutare la coerenza del set di dati. Assicurarsi che lo strumento Compozitor elabori direttamente il DOI del riferimento e riempia il campo di ricerca con reference=10.1101/2021.03.14.435332 nella scheda Avanzate dello strumento. Digitare &glycan_type=O-linked dopo il numero DOI per restringere la ricerca ai glicani legati all'O, in modo che la query diventi: riferimento=10.1101/2021.03.14.435332&glycan_
      type=O-linked
    4. Fare clic sul pulsante Aggiungi alla selezione per recuperare i dati dal database (ci sono 20 composizioni collegate a O). Mantenere selezionata l'opzione Includi nodi virtuali . Fare clic sul pulsante Calcola grafico per visualizzare il grafico delle composizioni collegate. Questo risultato evidenzia diverse lacune nella continuità attesa della biosintesi del glicano con nove nodi virtuali necessari per completare il grafico (Figura 7).
  2. Confronto con l'O-glicoma di una proteina sierica selezionata in GlyConnect
    NOTA: Per valutare se le lacune possono essere colmate dai dati memorizzati in GlyConnect, è stata selezionata una proteina O-glicosilata delle 37 elencate con il riferimento. Nel set di dati, l'inibitore dell'inter-alfa-tripsina H4 (Q14624) è segnalato per essere un O-glicosilato su Thr-725.
    1. Vai alla scheda Proteine di GlyConnect Compozitor (vedi passaggio 2.1.3). Dall'elenco delle proteine , selezionare Inter-alfa-tripsin inibitore della catena pesante H4. Assicurarsi che la selezione delle specie sia Homo sapiens per impostazione predefinita. Deselezionare N-linked nel tipo Glycan. Selezionare solo Thr-725 nell'elenco Sito facendo prima clic sul segno meno a sinistra di Sito per deselezionare tutti i siti, quindi selezionando solo Thr-725 dall'elenco.
    2. Fare clic sul pulsante Aggiungi alla selezione (si noti che sei composizioni sono associate a Thr-725). Fare clic sul pulsante Calcola grafico per visualizzare il grafico delle composizioni collegate (Figura supplementare 8).
    3. Osserva il grafico visualizzato, che mostra le 17 composizioni uniche delle 20 composizioni collegate o del set di dati dell'articolo in blu e le tre uniche su sei nel database in rosso. In altre parole, la sovrapposizione tra le due fonti è presente in tre composizioni che sono rappresentate in magenta. Si noti che una rotazione di 45° del grafico viene generata automaticamente.
      NOTA: il numero di nodi virtuali è ridotto di uno. A quanto pare, H2N2S1 mancante nelle 20 composizioni O-linked del set di dati dell'articolo e rappresentato come un nodo virtuale è ora riempito con una composizione aggiuntiva associata a Thr-725 della catena pesante H4 dell'inibitore dell'inter-alfa-tripsina nel database. Ciò semplifica la topologia del grafico perché altri due nodi virtuali vengono resi inutili poiché erano opzioni alternative per colmare il divario tra H1N2S1 e H2N2S2. Tuttavia, una seconda composizione importata dal database sarebbe isolata se non fosse per la creazione di due nuovi nodi virtuali alternativi H2N2F1S1 e H1N2F2S1.
    4. Per dare un senso ai nodi virtuali, verificare se le composizioni corrispondenti sono presenti in GlyConnect. Per fare ciò, fai clic sul pulsante Esporta sotto il grafico. Selezionare Solo virtuale deselezionando tutte le altre opzioni. Fare clic sull'icona degli appunti per copiare la selezione di 8 composizioni.
    5. Incollare la selezione nella finestra di query della scheda Personalizzata di Compozitor. Selezionare O-linked nel campo Tipo di glicano . Impostare l'etichetta di selezione nel campo Composizioni su, ad esempio, VN per denominare l'elenco di 8 composizioni. Fare clic sul pulsante Aggiungi alla selezione e quindi sul pulsante Calcola grafico . Tutti i nodi virtuali vengono ora visualizzati come nodi verdi (Figura 8).

Risultati

La prima parte del protocollo (sezione 1) ha mostrato come indagare la specificità o la comunanza di N-glicani attaccati su Asn-69 dell'antigene prostatico specifico umano (PSA) utilizzando la piattaforma GlyConnect. Le variazioni dipendenti dai tessuti (urina e liquido seminale), così come le variazioni isoforme-dipendenti (normale e ad alto pI) nell'espressione del glicano, sono state enfatizzate utilizzando due strumenti di visualizzazione (Figura 4 e

Discussione

GlyConnect Octopus come strumento per rivelare correlazioni inaspettate
GlyConnect Octopus è stato originariamente progettato per interrogare il database con una definizione libera di glicani. Infatti, la letteratura riporta spesso le principali caratteristiche dei glicani in un glicoma come essere fucosilati o sializzati, essere fatti di due o più antenne, ecc. Inoltre, i glicani, sia N- che O-linked, sono classificati in nuclei, come dettagliato nel manuale di riferimento Essentials of

Divulgazioni

Gli autori non dichiarano conflitti di interesse.

Riconoscimenti

L'autore riconosce calorosamente i membri passati e presenti del Proteome Informatics Group coinvolti nello sviluppo delle risorse utilizzate in questo tutorial, in particolare, Julien Mariethoz e Catherine Hayes per GlyConnect, François Bonnardel per UniLectin, Davide Alocci e Frederic Nikitin per Octopus e Thibault Robin per Compozitor e tocco finale su Octopus.

Lo sviluppo del progetto glyco@Expasy è sostenuto dalla Confederazione attraverso la Segreteria di Stato per la formazione, la ricerca e l'innovazione (SEFRI) ed è attualmente integrato dal Fondo nazionale svizzero per la ricerca scientifica (FNS: 31003A_179249). ExPASy è gestito dall'Istituto Svizzero di Bioinformatica e ospitato presso il Vital-IT Competency Center. L'autore riconosce anche Anne Imberty per l'eccezionale cooperazione sulla piattaforma UniLectin sostenuta congiuntamente da ANR PIA Glyco@Alps (ANR-15-IDEX-02), Alliance Campus Rhodanien Co-funds (http://campusrhodanien.unige-cofunds.ch) Labex Arcane/CBH-EUR-GS (ANR-17-EURE-0003).

Materiali

NameCompanyCatalog NumberComments
internet connectionuser's choice
recent version of web browseruser's choice

Riferimenti

  1. Spring Harbor Laboratory Press. . Essentials of Glycobiology. , (2015).
  2. Gray, C. J., et al. Advancing solutions to the carbohydrate sequencing challenge. Journal of the American Chemical Society. 141 (37), 14463-14479 (2019).
  3. Tsuchiya, S., Yamada, I., Aoki-Kinoshita, K. F. GlycanFormatConverter: a conversion tool for translating the complexities of glycans. Bioinformatics. 35 (14), 2434-2440 (2018).
  4. Fujita, A., et al. The international glycan repository GlyTouCan version 3.0. Nucleic Acids Research. 49, 1529-1533 (2021).
  5. Alocci, D., et al. GlyConnect: glycoproteomics goes visual, interactive, and analytical. Journal of Proteome Research. 18 (2), 664-677 (2019).
  6. York, W. S., et al. GlyGen: computational and informatics resources for glycoscience. Glycobiology. 30 (2), 72-73 (2020).
  7. Watanabe, Y., Aoki-Kinoshita, K. F., Ishihama, Y., Okuda, S. GlycoPOST realizes FAIR principles for glycomics mass spectrometry data. Nucleic Acids Research. 49, 1523-1528 (2020).
  8. Campbell, M. P., Aoki-Kinoshita, K. F., Lisacek, F., York, W. S., Packer, N. H. Glycoinformatics. Essentials of Glycobiology. , (2015).
  9. Cao, W., et al. Recent advances in software tools for more generic and precise intact glycopeptide analysis. Molecular & Cellular Proteomics. 20, 100060 (2021).
  10. Mariethoz, J., Hayes, C., Lisacek, F. Glycan compositions with Compozitor to enhance glycopeptide identification. Proteomics Data Analysis. 2361, 109-127 (2021).
  11. Kawahara, R., et al. Communityevaluation of glycoproteomics informatics solutions reveals high-performance search strategies of serum glycopeptide analysis. Nature Methods. 18, 1304-1316 (2021).
  12. Lisacek, F., Aoki-Kinoshita, K. F., Vora, J. K., Mazumder, R., Tiemeyer, M. Glycoinformatics resources integrated through the GlySpace Alliance. Comprehensive Glycoscience. 1, 507-521 (2021).
  13. Mariethoz, J., et al. Glycomics@ExPASy: bridging the gap. Molecular & Cellular Proteomics. 17 (11), 2164-2176 (2018).
  14. Duvaud, S., et al. Expasy, the swiss bioinformatics resource portal, as designed by its users. Nucleic Acids Research. 49, 216-227 (2021).
  15. The UniProt Consortium et al. UniProt: the universal protein knowledgebase in 2021. Nucleic Acids Research. 49, 480-489 (2021).
  16. Bonnardel, F., Perez, S., Lisacek, F., Imberty, A. Structural database for lectins and the UniLectin web platform. Lectin Purification and Analysis. 2132, 1-14 (2020).
  17. Neelamegham, S., et al. Updates to the symbol nomenclature for glycans guidelines. Glycobiology. 29 (9), 620-624 (2019).
  18. Sharon, N. IUPAC-IUB Joint Commission on Biochemical Nomenclature (JCBN). Nomenclature of glycoproteins, glycopeptides and peptidoglycans: JCBN recommendations 1985. Glycoconjugate Journal. 3 (2), 123-133 (1986).
  19. Harvey, D. J., et al. Proposal for a standard system for drawing structural diagrams of N- and O-linked carbohydrates and related compounds. Proteomics. 9 (15), 3796-3801 (2009).
  20. Song, E., Mayampurath, A., Yu, C. -. Y., Tang, H., Mechref, Y. Glycoproteomics: identifying the glycosylation of prostate specific antigen at normal and high isoelectric points by LC-MS/MS. Journal of Proteome Research. 13 (12), 5570-5580 (2014).
  21. Moran, A. B., et al. Profiling the proteoforms of urinary prostate-specific antigen by capillary electrophoresis - mass spectrometry. Journal of Proteomics. 238, 104148 (2021).
  22. Wang, W., et al. High-throughput glycopeptide profiling of prostate-specific antigen from seminal plasma by MALDI-MS. Talanta. 222, 121495 (2021).
  23. wwPDB consortium metal. Protein Data Bank: the single global archive for 3D macromolecular structure data. Nucleic Acids Research. 47, 520-528 (2019).
  24. Sehnal, D., Grant, O. C. Rapidly display glycan symbols in 3D structures: 3D-SNFG in LiteMol. Journal of Proteome Research. 18 (2), 770-774 (2019).
  25. Bonnardel, F., et al. UniLectin3D, a database of carbohydrate binding proteins with curated information on 3D structures and interacting ligands. Nucleic Acids Research. 47, 1236-1244 (2019).
  26. Sehnal, D., et al. LiteMol suite: interactive web-based visualization of large-scale macromolecular structure data. Nature Methods. 14 (12), 1121-1122 (2017).
  27. Salentin, S., Schreiber, S., Haupt, V. J., Adasme, M. F., Schroeder, M. PLIP: fully automated protein-ligand interaction profiler. Nucleic Acids Research. 43, 443-447 (2015).
  28. Robin, T., Mariethoz, J., Lisacek, F. Examining and fine-tuning the selection of glycan compositions with GlyConnect Compozitor. Molecular & Cellular Proteomics. 19 (10), 1602-1618 (2020).
  29. Compagno, D., et al. Glycans and galectins in prostate cancer biology, angiogenesis and metastasis. Glycobiology. 24 (10), 899-906 (2014).
  30. Gentilini, L. D., et al. Stable and high expression of Galectin-8 tightly controls metastatic progression of prostate cancer. Oncotarget. 8 (27), 44654-44668 (2017).
  31. Schwämmle, V., Verano-Braga, T., Roepstorff, P. Computational and statistical methods for high-throughput analysis of post-translational modifications of proteins. Journal of Proteomics. 129, 3-15 (2015).
  32. Khatri, K., Klein, J. A., Zaia, J. Use of an informed search space maximizes confidence of site-specific assignment of glycoprotein glycosylation. Analytical and Bioanalytical Chemistry. 409 (2), 607-618 (2017).
  33. Sztain, T., et al. A glycan gate controls opening of the SARS-CoV-2 spike protein. Nature Chemistry. 13, 963-968 (2021).

Ristampe e Autorizzazioni

Richiedi autorizzazione per utilizzare il testo o le figure di questo articolo JoVE

Richiedi Autorizzazione

Esplora altri articoli

BiologiaNumero 179

This article has been published

Video Coming Soon

JoVE Logo

Riservatezza

Condizioni di utilizzo

Politiche

Ricerca

Didattica

CHI SIAMO

Copyright © 2025 MyJoVE Corporation. Tutti i diritti riservati