CorExplorer trova i fattori di espressione genica associati al tumore in un modo che è matematicamente principiato utilizzando visualizzazioni interattive, nonché informazioni cliniche e di database per la scoperta biologica. CorEx esegue la massimizzazione delle informazioni in un modo che richiede relativamente pochi campioni per trovare cluster in dati ad alta dimensione. La gerarchia dei fattori latenti che produce facilita la comprensione biologica.
Questo metodo si è già dimostrato interessante se applicato alla biologia del cancro. Le sue basi teoriche dell'informazione lo rendono applicabile a qualsiasi sistema con molte variabili e poca conoscenza preliminare delle loro relazioni. Inizia navigando verso la home page di CorExplorer.
In Collegamenti rapidi fare clic sul pulsante di espansione più per visualizzare un riepilogo del grafico dei fattori CorEx che è stato addestrato sui dati sul cancro di interesse. Ad esempio, qui vengono mostrati i grafici fattoriali per i dati sul cancro ovarico TCGA. Dopo aver ispezionato i grafici dei fattori, fare clic su TCGA-LUAD polmonare per accedere alla pagina CorExplorer per il sequenziamento dell'RNA del cancro ai polmoni e utilizzare la finestra CorExplorer Factor Graph per esplorare il grafico dei fattori CorEx per un gene di interesse.
Durante lo spostamento del cursore del mouse sulla finestra di visualizzazione del grafico fattoriali, ingrandire il grafico fattoriali utilizzando il trackpad del mouse per visualizzare i dettagli del grafico, come i geni più importanti in ogni fattore e le connessioni tra i nodi a diversi livelli. Per individuare un gene bersaglio, fare clic sul menu Gene e digitare il nome del gene per selezionarlo nell'elenco a discesa. Premere Ritorno sulla tastiera per fare in modo che la vista ingrandisca il fattore con cui il gene di interesse è più fortemente correlato.
Riposizionare il mouse sulla visualizzazione del grafico e scorrere per eseguire lo zoom indietro per vedere il livello del nodo e i fattori associati che sono vicini al fattore genetico più strettamente associato. Si noti che vengono visualizzati solo i geni con un peso superiore alla soglia indicata sul cursore peso collegamento minimo. Per visualizzare tutti i geni associati al fattore, fare clic sul nodo appropriato e selezionare Carica geni aggiuntivi nella finestra popup.
Quando viene visualizzato Fatto (Done), chiudete la finestra popup. Nella sezione dell'intestazione, fate clic e trascinate il modificatore min Link Weight su 0,05 per consentire ai geni di apparire in ordine di peso. Per identificare le associazioni con una funzione biologica, nella finestra Annotazione deselezionare l'ordinamento del tasso di individuazione falso per ordinare il menu a discesa Fattore in base al numero del fattore anziché al tasso di individuazione falso.
Scorrere e fare clic per selezionare il fattore di interesse nel menu a discesa finestra annotazione per visualizzare le annotazioni di arricchimento per il fattore. Quindi fare clic su un fattore di arricchimento per visualizzare immediatamente i geni associati come evidenziato in giallo sul display del grafico. Si noti che i fattori che scompaiono o appaiono come termini GO diversi vengono selezionati in base al fatto che siano arricchiti o meno per i geni con l'annotazione selezionata.
Per i fattori di interesse del filtro, utilizzando la sopravvivenza e la qualità dei cluster, dal menu a discesa Set di dati selezionare TCGA_OVCA per passare alla pagina CorExplorer per il sequenziamento dell'RNA del cancro ovarico TCGA. Notare dalla finestra Sopravvivenza il fattore con il differenziale di sopravvivenza più grande e selezionare questo fattore nella finestra Grafico fattori dal menu a discesa Fattore. Fate clic e trascinate il dispositivo di scorrimento Peso collegamento a 0,5 e notete il numero di geni nel fattore.
Espandere l'elenco dei fattori nella finestra Sopravvivenza e fare clic sul fattore migliore successivo nell'elenco a discesa della finestra Sopravvivenza per visualizzare le curve di sopravvivenza associate. Verranno visualizzate le annotazioni significative GO e Kegg. Per comprendere meglio il ruolo biologico dei geni in questo fattore, selezionare lo strato fattore nella parte superiore della finestra del grafico fattorino e spostare il mouse sulla finestra mentre si esegue lo zoom indietro per rivelare l'intero cluster e i fattori associati.
Per comprendere il significato relativo dei fattori collegati al nodo cluster deselezionare Ordina per p-val nella finestra Sopravvivenza e fare clic su ciascuno dei numeri dei fattori in successione per visualizzarli, notando i fattori che mostrano un'associazione di sopravvivenza. Nel menu Aggiungi finestra selezionare PPI e fare clic su Aggiungi per aggiungere una finestra del grafico PPI all'area di visualizzazione. Nella finestra del grafico PPI selezionare uno strato fattoriali di interesse per visualizzare le interazioni proteina-proteina significative.
Fare clic sul collegamento Visualizza in StringDB per connettersi al database online STRINGdb e fare clic su Continua. Quindi aprire la scheda Anaylsis per ottenere un'analisi GO online per i geni della rete PPI. Verrà visualizzato il componente cellulare superiore.
Tornare alla scheda CorExplorer e alla finestra PPI e selezionare un altro fattore. Fare di nuovo clic sul collegamento Visualizza in StringDB. Verrà visualizzato un componente cellulare superiore diverso.
Quindi, nella finestra PPI, selezionare un altro fattore per un'analisi del database STRING. Per trovare punti in comune e differenze di variazione dell'espressione genica tra i tipi di tumore, fare clic sull'intestazione CorExplorer per tornare in prima pagina e fare clic su Cerca per accedere a una pagina che consenta la ricerca di tutti i set di dati sul sito CorExplorer. Nella casella Ricerca geni immettere un nome gene di interesse e fare clic su Cerca.
Ad esempio, come dimostrato FLT1 si trova con un peso relativamente elevato e più fattori diversi. La ricerca del gene BRCA1 nel set di dati sul cancro ai polmoni rivela che il gene è il più fortemente associato al fattore CorEx 26. Il termine GO arricchimento per questo fattore è estremamente elevato, con la riparazione del DNA che mostra un tasso di scoperta falso di solo uno per 10 a -19.
La selezione richiama inoltre l'attenzione sul cluster di L2_8 che presenta sei fattori strettamente correlati da bambini. La rete di interazione proteina-proteina di riparazione del DNA è fortemente connessa, supportando ulteriormente la funzionalità strettamente legata dei geni nel fattore 26. I grafici di sopravvivenza associati suggeriscono una possibile associazione con la sopravvivenza del paziente che dovrebbe essere confermata in un set di dati più grande.
A partire dalla valutazione di sopravvivenza può consentire la dissezione dei fattori che sono correlati con una migliore sopravvivenza associata a particolari gruppi di espressione genica. L'aggiunta di una finestra di interazione proteina-proteina per ogni fattore a sua volta facilita la determinazione di possibili spiegazioni per le loro associazioni con la sopravvivenza. È importante controllare le mappe di calore per ogni fattore per confermare che il modello di espressione genica è di qualità adeguata per supportare le interpretazioni biologiche.
Le mappe di calore che mostrano forti e chiare variazioni nei modelli di espressione genica possono mostrare un'espressione coordinata dei geni fattoriali, che vanno da modelli alti a bassi, o modelli più complessi, con alcuni geni con bassa espressione correlata ad altri geni con un'alta espressione. L'obiettivo generale di questa procedura è quello di impostare una terapia personalizzata mappando un tumore fuori campione sui fattori CorExplorer per identificare potenziali terapie specifiche del tumore.