JUMPn: un'applicazione semplificata per il clustering di co-espressione proteica e l'analisi di rete in proteomica

David Vanderwall; Poudel Suresh; Yingxue Fu; Ji-Hoon Cho; Timothy I. Shaw; Ashutosh Mishra; Anthony A. High; Junmin Peng; Yuxin Li

doi:10.3791/62796

È necessario avere un abbonamento a JoVE per visualizzare questo. Accedi o inizia la tua prova gratuita.

In questo articolo

Riepilogo
Abstract
Introduzione
Protocollo
Risultati
Discussione
Divulgazioni
Riconoscimenti
Materiali
Riferimenti
Ristampe e Autorizzazioni

Riepilogo

Presentiamo uno strumento di biologia dei sistemi JUMPn per eseguire e visualizzare l'analisi di rete per i dati quantitativi di proteomica, con un protocollo dettagliato che include la pre-elaborazione dei dati, il clustering di co-espressione, l'arricchimento del percorso e l'analisi della rete di interazione proteina-proteina.

Abstract

Con i recenti progressi nelle tecnologie di proteomica basate sulla spettrometria di massa, la profilazione profonda di centinaia di proteomi è diventata sempre più fattibile. Tuttavia, ricavare informazioni biologiche da set di dati così preziosi è una sfida. Qui introduciamo un software basato sulla biologia dei sistemi JUMPn e il suo protocollo associato per organizzare il proteoma in cluster di co-espressione proteica attraverso campioni e reti di interazione proteina-proteina (PPI) collegate da moduli (ad esempio, complessi proteici). Utilizzando la piattaforma R/Shiny, il software JUMPn semplifica l'analisi del clustering di co-espressione, dell'arricchimento del percorso e del rilevamento dei moduli PPI, con la visualizzazione dei dati integrata e un'interfaccia user-friendly. Le fasi principali del protocollo includono l'installazione del software JUMPn, la definizione di proteine differenzialmente espresse o del proteoma (dis)regolato, la determinazione di cluster di co-espressione significativi e moduli PPI e la visualizzazione dei risultati. Mentre il protocollo è dimostrato utilizzando un profilo proteoma basato sull'etichettatura isobarica, JUMPn è generalmente applicabile a una vasta gamma di set di dati quantitativi (ad esempio, proteomica senza etichette). Il software e il protocollo JUMPn forniscono quindi un potente strumento per facilitare l'interpretazione biologica nella proteomica quantitativa.

Introduzione

La proteomica del fucile a pompa basata sulla spettrometria di massa è diventata l'approccio chiave per analizzare la diversità del proteoma di campioni complessi¹. Con i recenti progressi nella strumentazione di spettrometria di massa ^2,3, cromatografia ^4,5, rilevamento della mobilità ionica⁶, metodi di acquisizione (^{acquisizione 7} indipendente dai dati e acquisizione dipendente dai dati⁸), approcci di quantificazione (metodo di etichettatura dei peptidi isobarici multiplex, ad esempio TMT ^9,10 e quantificazione senza etichetta^11,12) e strategie di analisi dei dati. sviluppo software 13,14,15,16,17,18, quantificazione dell'intero proteoma (ad esempio, oltre 10.000 proteine) è ora di routine 19,20,21. Tuttavia, come ottenere approfondimenti meccanicistici da set di dati quantitativi così profondi è ancora impegnativo²². I tentativi iniziali di indagare su questi set di dati si basavano prevalentemente sull'annotazione di singoli elementi dei dati, trattando ogni componente (proteina) in modo indipendente. Tuttavia, i sistemi biologici e il loro comportamento non possono essere spiegati esclusivamente esaminando i singoli componenti²³. Pertanto, un approccio sistemico che colloca le biomolecole quantificate nel contesto delle reti di interazione è essenziale per la comprensione dei sistemi complessi e dei processi associati come l'embriogenesi, la risposta immunitaria e la patogenesi delle malattie umane²⁴.

La biologia dei sistemi basata sulla rete è emersa come un potente paradigma per l'analisi dei dati quantitativi di proteomica su larga scala 25,26,27,28,29,30,31,32,33. Concettualmente, sistemi complessi come le cellule di mammifero potrebbero essere modellati come una rete gerarchica^34,35, in cui l'intero sistema è rappresentato in livelli: prima da un numero di componenti di grandi dimensioni, ognuno dei quali poi modellato iterativamente da sottosistemi più piccoli. Tecnicamente, la struttura della dinamica del proteoma può essere presentata da reti interconnesse di cluster proteici co-espressi (perché geni/proteine co-espressi spesso condividono funzioni biologiche simili o meccanismi di regolazione³⁶) e moduli PPI fisicamente interagenti³⁷. Come esempio recente²⁵, abbiamo generato profili temporali di proteoma intero e fosfoproteoma durante l'attivazione delle cellule T e utilizzato reti di co-espressione integrative con PPI per identificare moduli funzionali che mediano l'uscita di quiescenza delle cellule T. Sono stati evidenziati e convalidati sperimentalmente più moduli correlati alla bioenergetica (ad esempio, il mitoribosoma e i moduli IV complessi²⁵ e il modulo a un carbonio³⁸). In un altro esempio²⁶, abbiamo ulteriormente esteso il nostro approccio per studiare la patogenesi della malattia di Alzheimer e abbiamo dato priorità con successo ai moduli e alle molecole proteiche associate alla progressione della malattia. È importante sottolineare che molte delle nostre scoperte imparziali sono state convalidate da coorti di pazienti indipendenti^26,29 e / o modelli murini di malattia²⁶. Questi esempi hanno illustrato la potenza dell'approccio di biologia dei sistemi per sezionare i meccanismi molecolari con la proteomica quantitativa e altre integrazioni omiche.

Qui presentiamo JUMPn, un software semplificato che esplora i dati quantitativi di proteomica utilizzando approcci di biologia dei sistemi basati sulla rete. JUMPn funge da componente a valle della suite software di proteomica JUMP^13,14,39 e mira a colmare il divario dalle singole quantificazioni proteiche a percorsi biologicamente significativi e moduli proteici utilizzando l'approccio della biologia dei sistemi. Prendendo la matrice di quantificazione delle proteine differenzialmente espresse (o le più variabili) come input, JUMPn mira a organizzare il proteoma in una gerarchia a più livelli di cluster proteici co-espressi tra campioni e moduli PPI densamente connessi (ad esempio, complessi proteici), che sono ulteriormente annotati con database di percorsi pubblici mediante analisi di sovrarappresentazione (o arricchimento) (Figura 1). JUMPn è sviluppato con la piattaforma R/Shiny⁴⁰ per un'interfaccia user-friendly e integra tre principali moduli funzionali: analisi di clustering di co-espressione, analisi di arricchimento del percorso e analisi della rete PPI (Figura 1). Dopo ogni analisi, i risultati vengono visualizzati automaticamente e sono regolabili tramite le funzioni widget R/shiny e facilmente scaricabili come tabelle di pubblicazione in formato Microsoft Excel. Nel seguente protocollo, utilizziamo i dati quantitativi dell'intero proteoma come esempio e descriviamo i passaggi principali dell'utilizzo di JUMPn, inclusa l'installazione del software JUMPn, la definizione di proteine differenzialmente espresse o il proteoma (dis)regolato, l'analisi della rete di co-espressione e l'analisi del modulo PPI, la visualizzazione e l'interpretazione dei risultati e le riprese dei problemi. Il software JUMPn è disponibile gratuitamente su GitHub⁴¹.

Protocollo

NOTA: In questo protocollo, l'uso di JUMPn è illustrato utilizzando un set di dati pubblicato di profilazione dell'intero proteoma durante la differenziazione delle cellule B quantificata dal reagente isobarico dell'etichetta TMT²⁷.

1. Configurazione del software JUMPn

NOTA: per la configurazione del software JUMPn sono disponibili due opzioni: (i) installazione su un computer locale per uso personale; e (ii) distribuzione di JUMPn su un Shiny Server remoto per più utenti. Per l'installazione locale, un personal computer con accesso a Internet e ≥4 Gb di RAM è sufficiente per eseguire l'analisi JUMPn per un set di dati con una dimensione del campione ridotta (n < 30); per l'analisi di coorte di grandi dimensioni è necessaria una RAM più grande (ad esempio, 16 Gb) (ad esempio, n = 200 campioni).

Installare il software in un computer locale. Dopo l'installazione, consentire al browser Web di avviare JUMPn e lasciare che l'analisi venga eseguita sul computer locale.
1. Installare anaconda⁴² o miniconda⁴³ seguendo le istruzioni online.
2. Scarica il codice sorgente JUMPn⁴¹. Fare doppio clic per decomprimere il file scaricato JUMPn_v_1.0.0.zip; verrà creata una nuova cartella denominata JUMPn_v_1.0.0.
3. Apri il terminale della riga di comando. In Windows, utilizzare il prompt di Anaconda. Su MacOS, usa l'applicazione Terminale integrata.
4. Creare l'ambiente JUMPn Conda: ottenere il percorso assoluto della cartella JUMPn_v_1.0.0 (ad esempio, /path/to/JUMPn_v_1.0.0). Per creare e attivare un ambiente Conda vuoto digitare i seguenti comandi sul terminale
  conda create -p /path/to/JUMPn_v_1.0.0/JUMPn -y
  conda activate /path/to/JUMPn_v_1.0.0/JUMPn
5. Installare le dipendenze JUMPn: Installare R (sul terminale, digitare conda install -c conda-forge r=4.0.0 -y), modificare la directory corrente nella cartella JUMPn_v_1.0.0 (sul terminale, digitare cd path/to/JUMPn_v_1.0.0) e installare i pacchetti di dipendenza (sul terminale, digitare Rscript bootstrap. R)
6. Avvia JUMPn sul browser web: cambia la directory corrente nella cartella di esecuzione (sul terminale, digita cd execution) e avvia JUMPn (sul terminale, digita R -e "shiny::runApp()")
7. Una volta eseguito quanto sopra, la schermata del terminale verrà visualizzata In ascolto su http://127.0.0.1:XXXX (qui XXXX indica 4 numeri casuali). Copiare e incollare http://127.0.0.1:XXXX nel browser Web, in cui verrà visualizzata la pagina di benvenuto di JUMPn (Figura 2).
Distribuzione su Shiny Server. Esempi di Shiny Server includono il server commerciale shinyapps.io o qualsiasi server Shiny supportato istituzionalmente.
1. Scarica e installa RStudio seguendo le istruzioni⁴⁴.
2. Ottenere l'autorizzazione di distribuzione per Shiny Server. Per il server shinyapps.io, configurare l'account utente seguendo le istruzioni⁴⁵. Per il server Shiny istituzionale, contattare l'amministratore del server per richiedere le autorizzazioni.
3. Scaricare il codice sorgente JUMPn⁴¹ sul computer locale; l'installazione non è necessaria. Aprire il server. R o ui. R in RStudio e fai clic sul menu a discesa Pubblica su server in alto a destra dell'IDE di RStudio.
4. Nel pannello Pubblica su account , digitate l'indirizzo del server. Premere il pulsante Pubblica . La corretta distribuzione viene convalidata in caso di reindirizzamento automatico da RStudio al server RShiny in cui è stata distribuita l'applicazione.

2. Esecuzione della demo utilizzando un set di dati di esempio

NOTA: JUMPn offre un'esecuzione demo utilizzando il set di dati di proteomica delle cellule B pubblicato. L'esecuzione della demo illustra un flusso di lavoro semplificato che prende la matrice di quantificazione delle proteine differenzialmente espresse come input ed esegue il clustering di co-espressione, l'arricchimento del percorso e l'analisi della rete PPI in sequenza.

Nella home page di JUMPn (Figura 2), fare clic sul pulsante Inizia analisi per avviare l'analisi JUMPn.
Nell'angolo in basso a sinistra della pagina Inizia analisi (Figura 3), fare clic sul pulsante Carica dati proteomici B Cell Demo ; apparirà una finestra di dialogo che notifica l'esito positivo del caricamento dei dati.
Nell'angolo in basso a destra della pagina, fai clic sul pulsante Invia analisi JUMPn per avviare l'esecuzione della demo utilizzando i parametri predefiniti; apparirà una barra di avanzamento che denota il corso dell'analisi. Attendere fino a quando la barra di avanzamento non è soddisfatta (3 minuti previsti).
Al termine dell'esecuzione della demo, verrà visualizzata una finestra di dialogo con il messaggio di esecuzione riuscita e il percorso assoluto della cartella dei risultati. Clicca su Continua ai risultati per continuare.
La pagina Web guiderà innanzitutto l'utente ai risultati del cluster di coespressione di WGCNA. Fare clic su Visualizza risultati nella finestra di dialogo per continuare.
Trova i modelli di co-espressione proteica a sinistra della pagina dei risultati 1: Output WGCNA . Fare clic sulla casella a discesa Seleziona formato espressione per spostarsi tra due formati di figure:
1. Selezionare Tendenze per visualizzare il grafico delle tendenze, con ogni riga che rappresenta l'abbondanza di proteine individuali tra i campioni. Il colore di ogni riga rappresenta quanto sia vicino il modello di espressione al consenso del cluster di co-espressione (cioè "autogene" come definito dall'algoritmo WGCNA).
2. Selezionare Boxplot per visualizzare i modelli di coespressione in formato boxplot per ogni campione.
Visualizza la mappa di calore dell'arricchimento del percorso/ontologia a destra della pagina di output di WGCNA. I percorsi più arricchiti per ciascun cluster sono visualizzati insieme in una mappa di calore, con l'intensità del colore che riflette il valore p regolato da Benjamini-Hochberg.
Scorrere verso il basso la pagina Web per visualizzare il modello di espressione per le singole proteine.
1. Utilizzare la casella a discesa Selezionare il cluster di co-espressione per visualizzare le proteine di ciascun cluster (l'impostazione predefinita è Cluster 1). Seleziona una proteina specifica nella tabella, su cui il grafico a barre sotto la tabella verrà automaticamente aggiornato per riflettere la sua abbondanza proteica.
2. Cerca nomi di proteine specifiche utilizzando la casella di ricerca sul lato destro della tabella per una proteina specifica.
Per visualizzare i risultati PPI, fare clic sulla pagina dei risultati 2: Output PPI in alto.
Fare clic su Seleziona il cluster di co-espressione per visualizzare i risultati per uno specifico cluster di co-espressione (l'impostazione predefinita è il cluster 1). Le visualizzazioni di tutti i pannelli delle figure in questa pagina verranno aggiornate per il cluster appena selezionato.
Visualizzare le reti PPI per il cluster di coespressione selezionato nel pannello di sinistra:
1. Fare clic sulla casella a discesa Seleziona per gruppo per evidenziare i singoli moduli PPI all'interno della rete. Fare clic sulla casella a discesa Seleziona un formato di layout di rete per modificare il layout di rete (l'impostazione predefinita è di Fruchterman Reingold).
2. Utilizzare il mouse e il trackpad per eseguire i passaggi 2.11.3-2.11.5.
3. Ingrandire o rimpicciolire la rete PPI in base alle esigenze. I nomi dei geni di ciascun nodo della rete verranno mostrati quando vengono ingranditi a sufficienza.
4. Quando si esegue lo zoom avanti, selezionare e fare clic su una determinata proteina per evidenziare quella proteina e i suoi vicini di rete.
5. Trascinare un determinato nodo (proteina) nella rete per cambiarne la posizione nel layout; in tal modo il layout di rete può essere riorganizzato dall'utente.
Nel pannello di destra della pagina dei risultati PPI visualizzare le informazioni a livello di cluster di coespressione che facilitano l'interpretazione dei risultati PPI:
1. Visualizzare il modello di coespressione del cluster selezionato come boxplot per impostazione predefinita.
2. Fare clic sulla casella a discesa Seleziona il formato dell'espressione per ulteriori informazioni o visualizzazioni come indicato nei passaggi 2.12.3-2.12.5.
3. Selezionare Tendenze per visualizzare il grafico delle tendenze per il modello di coespressione.
4. Selezionare Pathway Barplot per mostrare percorsi significativamente arricchiti per il cluster di co-espressione.
5. Selezionate Diagramma cerchio percorso (Pathway Circle Plot ) per visualizzare percorsi significativamente arricchiti per il cluster di coespressione nel formato di grafico cerchio.
Scorrere verso il basso la pagina Web Dei risultati 2: Output PPI per visualizzare i risultati a livello di singolo modulo PPI. Fare clic sulla casella a discesa Seleziona il modulo per selezionare un modulo PPI specifico per la visualizzazione (Cluster1: Modulo 1 viene visualizzato per impostazione predefinita).
Visualizza il modulo PPI sul pannello di sinistra. Per manipolare la visualizzazione di rete, attenersi alla procedura 2.11.2-2.11.5.
Visualizza i risultati dell'arricchimento del percorso/ontologia sul pannello di destra. Fare clic sulla casella a discesa Seleziona lo stile di annotazione del percorso per ulteriori informazioni e visualizzare:
1. Selezionare Barplot per mostrare percorsi significativamente arricchiti per il modulo PPI selezionato.
2. Selezionate Plot cerchio (Circle Plot ) per visualizzare percorsi significativamente arricchiti per il modulo PPI selezionato nel formato di un grafico circolare.
3. Selezionare Heatmap per mostrare i percorsi significativamente arricchiti e i nomi dei geni associati dal modulo PPI selezionato.
4. Selezionare Tabella per visualizzare i risultati dettagliati dell'arricchimento del percorso, inclusi il nome dei termini di pathways/ontologia, i nomi dei geni e il valore P dal test esatto di Fisher.
Visualizzare la tabella di pubblicazione in formato foglio di calcolo: seguire il percorso assoluto (stampato nella parte superiore di entrambe le pagine dei risultati) e trovare la tabella del foglio di calcolo di pubblicazione denominata ComprehensiveSummaryTables.xlsx.

3. Preparazione del file di input e caricamento su JUMPn

NOTA: JUMPn prende come input la matrice di quantificazione delle proteine differenzialmente espresse (metodo supervisionato) o delle proteine più variabili (metodo non supervisionato). Se l'obiettivo del progetto è comprendere le proteine cambiate in più condizioni (ad esempio, diversi gruppi di malattie o analisi di serie temporali del processo biologico), è preferibile il metodo supervisionato per eseguire l'analisi DE; in caso contrario, un approccio non supervisionato di selezione delle proteine più variabili può essere utilizzato a scopo esplorativo.

Generare la tabella di quantificazione delle proteine, con ogni proteina come righe e ogni campione come colonne. Raggiungi questo obiettivo attraverso la moderna suite software di proteomica basata sulla spettrometria di massa (ad esempio, JUMP suite 13,14,39, Proteome Discoverer, Maxquant^15,46).
Definire il proteoma variabile.
1. Utilizzare i risultati dell'analisi statistica forniti dalla suite di software di proteomica per definire le proteine differenzialmente espresse (DE) (ad esempio, con valore p aggiustato < 0,05).
2. In alternativa, gli utenti possono seguire l'esempio R codice⁴⁷ per definire DE o la maggior parte delle proteine variabili.
Formattare il file di input utilizzando il proteoma variabile definito.
NOTA: il formato di file di input richiesto (Figura 4) include una riga di intestazione; le colonne includono l'adesione alle proteine (o eventuali ID univoci), GN (simboli genetici ufficiali), descrizione delle proteine (o qualsiasi informazione fornita dall'utente), seguita dalla quantificazione proteica dei singoli campioni.
1. Seguire l'ordine delle colonne specificato nel passaggio 3.1, ma i nomi delle colonne dell'intestazione sono flessibili per l'utente.
2. Per il proteoma quantificato TMT (o simile), utilizzare l'intensità del reporter TMT riepilogata come valori di quantificazione dell'input. Per i dati privi di etichette, utilizzare conteggi spettrali normalizzati (ad esempio, NSAF⁴⁸) o metodo basato sull'intensità (ad esempio, intensità LFQ o intensità della proteina iBAQ riportata da Maxquant⁴⁶).
3. I valori mancanti sono consentiti per l'analisi JUMPn. Assicurarsi di etichettarli come NA nella matrice di quantificazione. Tuttavia, si raccomanda di utilizzare proteine con quantificazione solo in oltre il 50% dei campioni.
4. Salvare il file di input risultante in formato .txt, .xlsx o .csv (tutti e tre sono supportati da JUMPn).
Carica file di input:
1. Fare clic sul pulsante Browser e selezionare il file di input (Figura 3, pannello di sinistra); il formato di file (xlsx, csv e txt sono supportati) verrà rilevato automaticamente.
2. Se il file di input contiene valori di quantificazione simili all'intensità (ad esempio, quelli generati dalla suite JUMP³⁹) o simili al rapporto (ad esempio, da Proteome Discoverer), selezionare Sì per l'opzione Esegui log2-trasformazione dei dati; in caso contrario, i dati potrebbero essere già stati trasformati nel registro, quindi selezionare No per questa opzione.

4. Analisi del clustering di co-espressione

NOTA: Il nostro gruppo 25,26,27 e altri 28,29,31 hanno dimostrato WGCNA ⁴⁹ un metodo efficace per l'analisi del clustering di co-espressione della proteomica quantitativa. JUMPn segue una procedura in 3 fasi per l'analisi WGCNA^25,50: (i) definizione iniziale di cluster gene/proteina di co-espressione mediante taglio dinamico dell'albero⁵¹ basato sulla matrice di sovrapposizione topologica (TOM; determinato dalle somiglianze di quantificazione tra geni/proteine); ii) fusione di cluster simili per ridurre la ridondanza (sulla base del dendrogramma delle somiglianze degli autogeni); e (iii) assegnazione finale di geni/proteine a ciascun cluster che superano il limite minimo di correlazione di Pearson.

Configurare i parametri WGCNA (Figura 3, pannello centrale). I tre parametri seguenti controllano rispettivamente i tre passaggi:
1. Impostare la dimensione minima del cluster su 30. Questo parametro definisce il numero minimo di proteine richieste per ogni cluster di co-espressione nella fase iniziale (i) del taglio dinamico dinamico ibrido basato su TOM. Maggiore è il valore, minore è il numero di cluster restituiti dall'algoritmo.
2. Impostare la distanza minima del cluster su 0,2. L'aumento di questo valore (ad esempio, da 0,2 a 0,3) può causare una maggiore fusione di cluster durante il passaggio (ii), con conseguente riduzione del numero di cluster.
3. Impostare il kME minimo su 0,7. Le proteine saranno assegnate al cluster più correlato definito nel passaggio (ii), ma solo le proteine con correlazione di Pearson che supera questa soglia saranno mantenute. Le proteine che falliscono in questa fase non saranno assegnate a nessun cluster (cluster 'NA' per le proteine fallite nel rapporto finale).
Avviare l'analisi. Esistono due modi per inviare l'analisi del clustering di coespressione:
1. Fare clic sul pulsante Invia analisi JUMPn nell'angolo in basso a destra per avviare automaticamente l'analisi completa di WGCNA seguita dall'analisi della rete PPI.
2. In alternativa, selezionare per eseguire solo il passaggio WGCNA (in particolare ai fini dell'ottimizzazione dei parametri; vedere i passaggi 4.2.3-4.2.4):
3. Fare clic sul pulsante Parametri avanzati nella parte inferiore della pagina Inizia analisi ; verrà visualizzata una nuova finestra dei parametri. Nel widget in basso, Seleziona modalità di analisi, seleziona Solo WGCNA, quindi fai clic su Ignora per continuare.
4. Nella pagina Inizia analisi , fare clic sul pulsante Invia analisi JUMPn .
5. In entrambi i casi sopra, una barra di avanzamento apparirà al momento dell'invio dell'analisi.
  NOTA: al termine dell'analisi (in genere < 1 minuto per l'analisi solo WGCNA e <3 minuti per l'analisi completa), verrà visualizzata una finestra di dialogo con un messaggio di esecuzione riuscita e il percorso assoluto della cartella dei risultati.
Esaminare i risultati del WGCNA come illustrato nei passaggi 2.4-2.8 (Figura 5). Si noti che il percorso assoluto del file co_exp_clusters_3colums.txt è evidenziato nella parte superiore della pagina dei risultati: WGCNA Output per registrare l'appartenenza al cluster di ciascuna proteina e utilizzarla come input per l'analisi PPI Only .
Risoluzione dei problemi. Vengono discussi i seguenti tre casi comuni. Una volta aggiornati i parametri come illustrato di seguito, seguire i passaggi 4.2.2-4.2.4 per generare nuovi risultati WGCNA.
1. Se dall'algoritmo è previsto un importante modello di co-espressione ma non è stato raggiunto dall'algoritmo, seguire i passaggi 4.4.2-4.4.4
2. Un cluster mancante è particolarmente probabile per piccoli cluster di co-espressione, cioè solo un numero limitato (ad esempio, <30) di proteine che presentano questo modello. Prima della nuova analisi, riesaminare il file di input della matrice di quantificazione delle proteine e individuare diverse proteine di controllo positive che aderiscono a quell'importante modello di co-espressione.
3. Per salvare i cluster di piccole dimensioni, ridurre la dimensione minima del cluster (ad esempio, 10; la dimensione del cluster inferiore a 10 potrebbe non essere robusta, quindi non consigliata) e diminuire la distanza minima del cluster (ad esempio, 0,1; qui è consentita anche l'impostazione come 0, il che significa che l'unione automatica del cluster verrà saltata).
4. Dopo aver eseguito il passaggio di clustering di co-espressione con i parametri aggiornati, in primo luogo, verificare se il cluster viene salvato dai grafici del modello di co-espressione, quindi controllare i controlli positivi cercando le loro accessioni proteiche da Detailed Protein Quantification (assicurarsi di selezionare il cluster di co-espressione appropriato dal widget a discesa sul lato sinistro prima della ricerca).
  NOTA: per il ripristino potrebbero essere necessarie più iterazioni di ottimizzazione ed esecuzione dei parametri.
5. Se ci sono troppe proteine che non possono essere assegnate a nessun cluster, seguire i passaggi 4.4.6-4.4.7.
  NOTA: Di solito, una piccola percentuale (in genere <10%) di proteine potrebbe non essere assegnata a nessun cluster in quanto potrebbero essere proteine anomale che non hanno seguito nessuno dei modelli di espressione comuni del set di dati. Tuttavia, se tale percentuale è significativa (ad esempio, >30%), suggerisce che esistono ulteriori modelli di co-espressione che non possono essere ignorati.
6. Ridurre i parametri Dimensione minima cluster e Distanza minima cluster per alleviare questa situazione rilevando "nuovi" cluster di coespressione.
7. Inoltre, ridurre il parametro Minimal Pearson Correlation (kME) per ridurre queste proteine "NA cluster".
  NOTA: l'ottimizzazione di questo parametro non genererà nuovi cluster, ma aumenterà invece la dimensione dei cluster "esistenti" accettando più proteine precedentemente fallite con la soglia inferiore; tuttavia, ciò aumenterà anche l'eterogeneità di ciascun cluster, poiché ora sono consentite proteine più rumorose.
8. Due cluster hanno una differenza molto minore di modelli; unirli in un unico cluster seguendo i passaggi 4.4.9-4.4.11.
9. Aumentare il parametro Minimal Cluster Distance per risolvere il problema.
10. Tuttavia, in alcune situazioni, l'algoritmo potrebbe non restituire mai il modello desiderato; in un istante del genere, regolare o modificare manualmente l'appartenenza al cluster nel file co_exp_clusters_3colums.txt (file dal passaggio 4.3) da unire.
11. Prendi il file post-modificato come input per l'analisi della rete PPI a valle. In caso di modifica manuale, giustificare i criteri di assegnazione del cluster e registrare la procedura di modifica manuale.

5. Analisi della rete di interazione proteina-proteina

NOTA: sovrapponendo cluster di coespressione alla rete PPI, ogni cluster di coespressione viene ulteriormente stratificato in moduli PPI più piccoli. L'analisi viene eseguita per ogni cluster di co-espressione e comprende due fasi: nella prima fase, JUMPn sovrappone le proteine del cluster di co-espressione alla rete PPI e trova tutti i componenti collegati (cioè più cluster di nodi/proteine connessi; ad esempio, vedi Figura 6A); quindi, comunità o moduli (di nodi densamente connessi) verranno rilevati per ciascun componente connesso iterativamente utilizzando il metodo TOM (Topological Overlap Matrix)⁵².

Configurare i parametri per l'analisi della rete PPI (Figura 3, pannello di destra).
1. Impostare La dimensione minima del modulo PPI su 2. Questo parametro definisce la dimensione minima dei componenti disconnessi dall'analisi della prima fase. Qualsiasi componente più piccolo del parametro specificato verrà rimosso dai risultati finali.
2. Impostare la dimensione massima del modulo PPI su 40. I componenti di grandi dimensioni e disconnessi che superano questa soglia saranno sottoposti a un'analisi basata su TOM di seconda fase. L'analisi del secondo stadio dividerà ulteriormente ogni componente di grandi dimensioni in moduli più piccoli: ogni modulo contiene presumibilmente proteine più densamente connesse rispetto al componente originale nel suo complesso.
Avviare l'analisi. Esistono due modi per inviare l'analisi della rete PPI:
1. Premere il pulsante Invia analisi JUMPn per eseguire automaticamente l'analisi PPI dopo l'analisi WGCNA per impostazione predefinita.
2. In alternativa, caricare i risultati del cluster di coespressione personalizzati ed eseguire l'analisi solo PPI seguendo i passaggi 5.2.3-5.2.5.
3. Preparare il file di input seguendo il formato del file co_exp_clusters_3colums.txt (vedere la sottosezione 4.4).
4. Fare clic sul pulsante Parametri avanzati nella parte inferiore della pagina Inizia analisi ; verrà visualizzata una nuova finestra dei parametri. Nella sessione superiore Upload Co-Expression Cluster Result for 'PPI Only' Analysis, fare clic su Browser per caricare il file di input preparato al passaggio 5.2.3.
5. Nel widget in basso, Seleziona modalità di analisi, seleziona Solo PPI, quindi fai clic su Ignora per continuare. Nella pagina Inizia analisi , fare clic sul pulsante Invia analisi JUMPn .
Una volta terminata l'analisi (in genere <3 min), esaminare i risultati PPI come illustrato nei passaggi 2.10-2.15 (Figura 6).
Passaggio avanzato opzionale) Regolare la modularizzazione PPI regolando i parametri:
1. Aumentare il parametro Maximal Module Size per consentire più proteine incluse nei risultati PPI. Carica una rete PPI personalizzata per coprire le interazioni non documentate, seguendo i passaggi 5.4.2-5.4.3.
2. Fare clic sul pulsante Parametri avanzati nella parte inferiore della pagina Inizia analisi ; verrà visualizzata una nuova finestra dei parametri. Preparare il file PPI personalizzato, che contiene tre colonne nel formato , C onnection e ; qui sono presentati dai nomi ufficiali dei geni di ciascuna proteina.
3. In Carica un database PPI, fare clic sul pulsante Sfoglia per caricare il file PPI personalizzato.

6. Analisi dell'arricchimento del percorso

NOTA: le strutture gerarchiche derivate da JUMPn di entrambi i cluster di co-espressione e i moduli PPI all'interno vengono automaticamente annotate con percorsi sovrarappresentati utilizzando il test esatto di Fisher. I database pathway/topologici utilizzati includono Gene Ontology (GO), KEGG, Hallmark e Reactome. Gli utenti possono utilizzare opzioni avanzate per caricare database personalizzati per l'analisi (ad esempio, nel caso di analisi di dati di specie non umane).

Per impostazione predefinita, l'analisi dell'arricchimento del percorso viene avviata automaticamente con il clustering di co-espressione e l'analisi della rete PPI.
Visualizza i risultati dell'arricchimento del percorso:
1. Seguire i passaggi 2.7, 2.12 e 2.15 per visualizzare formati diversi nelle pagine dei risultati. Visualizzare i risultati dettagliati nella tabella di pubblicazione del foglio di calcolo nel file ComprehensiveSummaryTables.xlsx (passaggio 2.16).
(Passaggio avanzato opzionale) Carica un database personalizzato per l'analisi dell'arricchimento del percorso:
1. Preparare il file di base del gene, che in genere contiene i nomi ufficiali dei geni di tutti i geni di una specie.
2. Preparare il file della libreria di ontologia seguendo i passaggi 6.3.3-6.3.4.
3. Scarica i file della libreria di ontologia da siti Web pubblici, tra cui EnrichR⁵³ e MSigDB⁵⁴. Ad esempio, scarica l'ontologia da Drosophila dal sito Web EnrichR⁵⁵.
4. Modifica il file scaricato per il formato richiesto con due colonne: il nome del percorso come prima colonna e quindi i simboli genetici ufficiali (separati da "/") come seconda colonna. Il formato di file dettagliato è descritto nella pagina di aiuto del software JUMPn R shiny.
  NOTA: trova file di esempio di background genetico e libreria di ontologia (usando Drosophila come istanza) nel sito JUMPn GitHub⁵⁶.
5. Fare clic sul pulsante Parametri avanzati nella parte inferiore della pagina Inizia analisi; verrà visualizzata una nuova finestra dei parametri.
6. Trova Carica un file in background per l'elemento Analisi arricchimento percorso e fai clic su Browser per caricare il file in background preparato al passaggio 6.3.1. Quindi, nella sessione, selezionare Lo sfondo da utilizzare per l'analisi dell'arricchimento del percorso, fare clic su Sfondo fornito dall'utente.
7. Trova Carica un file di libreria di ontologia per l'elemento analisi dell'arricchimento del percorso e fai clic su Browser per caricare il file della libreria di ontologia preparato ai passaggi 6.3.2-6.3.4. Quindi, nella sessione, selezionare Database per l'analisi dell'arricchimento del percorso, fare clic su Database fornito dall'utente in formato .xlsx.
Fare clic sul pulsante Invia analisi JUMPn nell'angolo in basso a destra per avviare l'analisi utilizzando il database personalizzato.

7. Analisi di dataset con campione di grandi dimensioni

NOTA: JUMPn supporta l'analisi di set di dati con campioni di grandi dimensioni (fino a 200 campioni testati). Per facilitare la visualizzazione di un campione di grandi dimensioni, è necessario un file aggiuntivo (denominato "meta file") che specifichi il gruppo di esempio per facilitare la visualizzazione dei risultati del clustering di coespressione.

Prepara e carica il meta file.
1. Preparare il meta file che specifica le informazioni sui gruppi (ad esempio, gruppi di controllo e di malattia) per ciascun campione seguendo i passaggi 7.1.2-7.1.3.
2. Assicurarsi che il meta file contenga almeno due colonne: la colonna 1 deve contenere i nomi dei campioni identici ai nomi delle colonne e l'ordine del file della matrice di quantificazione delle proteine (come preparato nel passaggio 3.3); La colonna 2 in poi verrà utilizzata per l'assegnazione di gruppo per qualsiasi numero di funzionalità definite dall'utente. Il numero di colonne è flessibile.
3. Assicurarsi che la prima riga del meta file contenga i nomi delle colonne per ogni colonna; dalla seconda riga in poi, dovrebbero essere elencate le informazioni sui singoli campioni di gruppi o altre caratteristiche (ad esempio, sesso, età, trattamento, ecc.).
4. Carica il meta file facendo clic sul pulsante Parametri avanzati nella parte inferiore della pagina Inizia analisi ; verrà visualizzata una nuova finestra dei parametri. Procedere al passaggio 7.1.5
5. Trova carica un elemento Meta File e fai clic su Browser per caricare il file in background. Se JUMPn rileva il formato imprevisto o nomi di esempio non corrispondenti, verrà visualizzato un messaggio di errore per un'ulteriore formattazione del meta file (passaggi 7.1.1-7.1.3).
Regolare i parametri per l'analisi del clustering di co-espressione: impostare Correlazione minima di Pearson su 0,2. Questo parametro deve essere allentato a causa della maggiore dimensione del campione.
Fare clic sul pulsante Invia analisi JUMPn nell'angolo in basso a destra per inviare l'analisi.
Visualizza i risultati dell'analisi: tutti i dati in uscita sono uguali ad eccezione della visualizzazione dei modelli di cluster di coespressione.
1. Nella pagina Risultati Pagina 1: Output WGCNA visualizzare i cluster di coespressione come boxplot con esempi stratificati dai gruppi di campioni o dalle funzionalità definiti dall'utente. Ogni punto nel grafico rappresenta l'autogene (cioè il modello di consenso del cluster) calcolato dall'algoritmo WGCNA.
2. Se l'utente ha fornito più funzionalità (ad esempio, età, sesso, trattamento, ecc.) per raggruppare i campioni, fare clic sulla casella a discesa Seleziona il formato dell'espressione per selezionare un'altra funzionalità per raggruppare i campioni.

Risultati

Abbiamo utilizzato i nostri set di dati di proteomica profonda^pubblicati 25,26,27,30 (Figure 5 e Figura 6) e le simulazioni di dati⁵⁷ (Tabella 1) per ottimizzare e valutare le prestazioni di JUMPn. Per l'analisi del clustering proteico di co-espressione tramite WGCNA, si consiglia di utilizzare ...

Discussione

Qui abbiamo introdotto il nostro software JUMPn e il suo protocollo, che sono stati applicati in più progetti per la dissezione di meccanismi molecolari utilizzando dati quantitativi profondi^di proteomica 25,26,27,30,64. Il software e il protocollo JUMPn sono stati completamente ottimizzati, compresa la considerazione delle proteine DE per l'analisi della ret...

Divulgazioni

Gli autori non hanno nulla da rivelare.

Riconoscimenti

Il sostegno finanziario è stato fornito dal National Institutes of Health (NIH) (R01AG047928, R01AG053987, RF1AG064909, RF1AG068581 e U54NS110435) e ALSAC (American Lebanese Syrian Associated Charities). L'analisi della SM è stata effettuata nel Centro di Proteomica e Metabolomica del St. Jude Children's Research Hospital, che è stato parzialmente supportato dal NIH Cancer Center Support Grant (P30CA021765). Il contenuto è di esclusiva responsabilità degli autori e non rappresenta necessariamente le opinioni ufficiali del National Institutes of Health.

Materiali

Name	Company	Catalog Number	Comments
MacBook Pro with a 2.3 GHz Quad-Core Processor running OS 10.15.7.	Apple Inc.	MacBook Pro 13''	Hardware used for software development and testing
Anoconda	Anaconda, Inc.	version 4.9.2	https://docs.anaconda.com/anaconda/install/
miniconda	Anaconda, Inc.	version 4.9.2	https://docs.conda.io/en/latest/miniconda.html
RStudio	RStudio Public-benefit corporation	version 4.0.3	https://www.rstudio.com/products/rstudio/download/
Shiny Server	RStudio Public-benefit corporation		https://shiny.rstudio.com/articles/shinyapps.html

Riferimenti

Aebersold, R., Mann, M. Mass-spectrometric exploration of proteome structure and function. Nature. 537, 347-355 (2016).
Senko, M. W., et al. Novel parallelized quadrupole/linear ion trap/orbitrap tribrid mass spectrometer improving proteome coverage and peptide identification rates. Analytical Chemistry. 85, 11710-11714 (2013).
Eliuk, S., Makarov, A. Evolution of orbitrap mass spectrometry instrumentation. Annual Review of Analytical Chemistry. 8, 61-80 (2015).
Wang, H., et al. Systematic optimization of long gradient chromatography mass spectrometry for deep analysis of brain proteome. Journal of Proteome Research. 14, 829-838 (2015).
Blue, L. E. Recent advances in capillary ultrahigh pressure liquid chromatography. Journal of Chromatography A. 1523, 17-39 (2017).
Meier, F., et al. Online parallel accumulation-serial fragmentation (PASEF) with a novel trapped ion mobility mass spectrometer. Molecular & Cellular Proteomics. 17, 2534-2545 (2018).
Ludwig, C., et al. Data-independent acquisition-based SWATH-MS for quantitative proteomics: a tutorial. Molecular Systems Biology. 14 (8), 8126 (2018).
Zhang, Y. Y., Fonslow, B. R., Shan, B., Baek, M. C., Yates, J. R. Protein analysis by shotgun/bottom-up proteomics. Chemical Reviews. 113, 2343-2394 (2013).
Wang, Z., et al. 27-Plex tandem mass tag mass spectrometry for profiling brain proteome in Alzheimer's disease. Analytical Chemistry. 92, 7162-7170 (2020).
Li, J. M., et al. TMTpro reagents: a set of isobaric labeling mass tags enables simultaneous proteome-wide measurements across 16 samples. Nature Methods. 17 (4), 399-404 (2020).
Collins, B. C., et al. Multi-laboratory assessment of reproducibility, qualitative and quantitative performance of SWATH-mass spectrometry. Nature Communications. 8 (1), 291 (2017).
Navarro, P., et al. A multicenter study benchmarks software tools for label-free proteome quantification. Nature Biotechnology. 34, 1130 (2016).
Wang, X. S., et al. A tag-based database search tool for peptide identification with high sensitivity and accuracy. Molecular & Cellular Proteomics. 13, 3663-3673 (2014).
Li, Y. X., et al. JUMPg: An integrative proteogenomics pipeline identifying unannotated proteins in human brain and cancer cells. Journal of Proteome Research. 15, 2309-2320 (2016).
Cox, J., Mann, M. MaxQuant enables high peptide identification rates, individualized p.p.b.-range mass accuracies and proteome-wide protein quantification. Nature Biotechnology. 26, 1367-1372 (2008).
Kong, A. T., Leprevost, F. V., Avtonomov, D. M., Mellacheruvu, D., Nesvizhskii, A. I. MSFragger: ultrafast and comprehensive peptide identification in mass spectrometry-based proteomics. Nature Methods. 14, 513 (2017).
Chi, H., et al. Comprehensive identification of peptides in tandem mass spectra using an efficient open search engine. Nature Biotechnology. 36, 1059 (2018).
Demichev, V., Messner, C. B., Vernardis, S. I., Lilley, K. S., Ralser, M. DIA-NN neural networks and interference correction enable deep proteome coverage in high throughput. Nature Methods. 17, 41 (2020).
High, A. A., et al. Deep proteome profiling by isobaric labeling, extensive liquid chromatography, mass spectrometry, and software-assisted quantification. Journal of Visualized Experiments: JoVE. (129), e56474 (2017).
Wang, Z., et al. High-throughput and deep-proteome profiling by 16-plex tandem mass tag labeling coupled with two-dimensional chromatography and mass spectrometry. Journal of Visualized Experiments: JoVE. (162), e61684 (2020).
Meier, F., Geyer, P. E., Winter, S. V., Cox, J., Mann, M. BoxCar acquisition method enables single-shot proteomics at a depth of 10,000 proteins in 100 minutes. Nature Methods. 15, 440 (2018).
Sinitcyn, P., Rudolph, J. D., Cox, J. Computational methods for understanding mass spectrometry-based shotgun proteomics data. Annual Review of Biomedical Data Science. 1, 207-234 (2018).
Ideker, T., Galitski, T., Hood, L. A new approach to decoding life: Systems biology. Annual Review of Genomics and Human Genetics. 2, 343-372 (2001).
Barabasi, A. L., Oltvai, Z. N. Network biology: understanding the cell's functional organization. Nature Reviews Genetics. 5, 101-113 (2004).
Tan, H., et al. Integrative proteomics and phosphoproteomics profiling reveals dynamic signaling networks and bioenergetics pathways underlying T cell activation. Immunity. 46, 488-503 (2017).
Bai, B., et al. Deep multilayer brain proteomics identifies molecular networks in alzheimer's disease progression. Neuron. 105, 975-991 (2020).
Zeng, H., et al. Discrete roles and bifurcation of PTEN signaling and mTORC1-mediated anabolic metabolism underlie IL-7-driven B lymphopoiesis. Science Advances. 4, 5701 (2018).
Seyfried, N. T., et al. A multi-network approach identifies protein-specific co-expression in asymptomatic and symptomatic Alzheimer's disease. Cell Systems. 4, 60-72 (2017).
Johnson, E. C. B., et al. Large-scale proteomic analysis of Alzheimer's disease brain and cerebrospinal fluid reveals early changes in energy metabolism associated with microglia and astrocyte activation. Nature Medicine. 26, 769-780 (2020).
Stewart, E., et al. Identification of therapeutic targets in rhabdomyosarcoma through integrated genomic, epigenomic, and proteomic analyses. Cancer Cell. 34, 411-426 (2018).
Rudolph, J. D., Cox, J. A network module for the perseus software for computational proteomics facilitates proteome interaction graph analysis. Journal of Proteome Research. 18, 2052-2064 (2019).
Zhang, B., et al. Proteogenomic characterization of human colon and rectal cancer. Nature. 513, 382 (2014).
Petralia, F., et al. Integrated proteogenomic characterization across major histological types of pediatric brain cancer. Cell. 183, 1962 (2020).
Dutkowski, J., et al. A gene ontology inferred from molecular networks. Nature Biotechnology. 31, 38 (2013).
Yu, M. K., et al. Translation of genotype to phenotype by a hierarchy of cell subsystems. Cell Systems. 2, 77-88 (2016).
Jansen, R., Greenbaum, D., Gerstein, M. Relating whole-genome expression data with protein-protein interactions. Genome Research. 12, 37-46 (2002).
Huttlin, E. L., et al. Architecture of the human interactome defines protein communities and disease networks. Nature. 545, 505-509 (2017).
Ron-Harel, N., et al. Mitochondrial biogenesis and proteome remodeling promote one-carbon metabolism for T cell activation. Cell Metabolism. 24, 104-117 (2016).
Niu, M. M., et al. Extensive peptide fractionation and y(1) ion-based interference detection method for enabling accurate quantification by isobaric labeling and mass spectrometry. Analytical Chemistry. 89, 2956-2963 (2017).
Chang, W. shiny: Web Application Framework for. Nature Protocols. 11, 2301-2319 (2021).
. JUMPn Available from: https://github.com/VanderwallDavid/JUMPn_1.0.0 (2021)
. Anaconda Available from: https://docs.anaconda.com/anaconda/install/ (2021)
. miniconda Available from: https://docs.conda.io/en/latest/miniconda.html (2021)
. RStudio Available from: https://www.rstudio.com/products/rstudio/download/ (2021)
. Shiny Server Available from: https://shiny.rstudio.com/articles/shinyapps.html (2021)
Tyanova, S., Temu, T., Cox, J. The MaxQuant computational platform for mass spectrometry-based shotgun proteomics. Nature Protocol. 11, 2301-2319 (2016).
. R code Available from: https://github.com/VanderwallDavid/JUMPn_1.0.0/tree/main/JUMPn_preprocessing (2021)
Florens, L., et al. Analyzing chromatin remodeling complexes using shotgun proteomics and normalized spectral abundance factors. Methods. 40, 303-311 (2006).
Zhang, B., Horvath, S. A general framework for weighted gene co-expression network analysis. Statistical Applications in Genetics and Molecular Biology. 4, (2005).
Voineagu, I., et al. Transcriptomic analysis of autistic brain reveals convergent molecular pathology. Nature. 474, 380 (2011).
Langfelder, P., Zhang, B., Horvath, S. Defining clusters from a hierarchical cluster tree: the Dynamic Tree Cut package for R. Bioinformatics. 24, 719-720 (2008).
Ravasz, E., Somera, A. L., Mongru, D. A., Oltvai, Z. N., Barabasi, A. L. Hierarchical organization of modularity in metabolic networks. Science. 297, 1551-1555 (2002).
Kuleshov, M. V., et al. Enrichr: a comprehensive gene set enrichment analysis web server 2016 update. Nucleic Acids Research. 44, 90-97 (2016).
Liberzon, A., et al. Molecular signatures database (MSigDB) 3.0. Bioinformatics. 27, 1739-1740 (2011).
. FlyEn rich r Available from: https://maayanlab.cloud/FlyEnrichr/#stats (2021)
. JUMPn GitHub Available from: https://github.com/VanderwallDavid/JUMPn_1.0.0/tree/main/resources/example_fly (2021)
Langfelder, P., Horvath, S. Eigengene networks for studying the relationships between co-expression modules. BMC Systems Biology. 1, 54 (2007).
Benjamini, Y., Hochberg, Y. Controlling the false discovery rate - a practical and powerful approach to multiple testing. Journal of the Royal Statistical Society: Series B. 57, 289-300 (1995).
Szklarczyk, D., et al. STRING v10: protein-protein interaction networks, integrated over the tree of life. Nucleic Acids Research. 43, 447-452 (2015).
Szklarczyk, D., et al. STRING v11: protein-protein association networks with increased coverage, supporting functional discovery in genome-wide experimental datasets. Nucleic Acids Research. 47, 607-613 (2019).
Huttlin, E. L., et al. The BioPlex network: A systematic exploration of the human interactome. Cell. 162, 425-440 (2015).
Huttlin, E. L., et al. Dual proteome-scale networks reveal cell-specific remodeling of the human interactome. Cell. 184, 3022-3040 (2021).
Li, T., et al. A scored human protein-protein interaction network to catalyze genomic interpretation. Nature Methods. 14, 61-64 (2017).
Wang, H., et al. Deep multiomics profiling of brain tumors identifies signaling networks downstream of cancer driver genes. Nature Communications. 10, 3718 (2019).
Gerstein, M. B., et al. Architecture of the human regulatory network derived from ENCODE data. Nature. 489, 91-100 (2012).
Yu, J., Peng, J., Chi, H. Systems immunology: Integrating multi-omics data to infer regulatory networks and hidden drivers of immunity. Current Opinion in Systems Biology. 15, 19-29 (2019).
Califano, A., Alvarez, M. J. The recurrent architecture of tumour initiation, progression and drug sensitivity. Nature Reviews Cancer. 17, 116-130 (2017).
Hein, M. Y., et al. A human interactome in three quantitative dimensions organized by stoichiometries and abundances. Cell. 163, 712-723 (2015).
Liang, Z., Xu, M., Teng, M. K., Niu, L. W. Comparison of protein interaction networks reveals species conservation and divergence. BMC Bioinformatics. 7, 457 (2006).
Shou, C., et al. Measuring the evolutionary rewiring of biological networks. PLOS Computational Biology. 7, 1001050 (2011).
Zhou, Y., et al. Metascape provides a biologist-oriented resource for the analysis of systems-level datasets. Nature Communications. 10, 1523 (2019).
Cline, M. S., et al. Integration of biological networks and gene expression data using Cytoscape. Nature Protocols. 2, 2366-2382 (2007).

Ristampe e Autorizzazioni

Richiedi autorizzazione per utilizzare il testo o le figure di questo articolo JoVE

Richiedi Autorizzazione

Esplora altri articoli

Biochimica Numero 176

This article has been published

Video Coming Soon

Keep me updated: