JoVE Logo

Accedi

È necessario avere un abbonamento a JoVE per visualizzare questo. Accedi o inizia la tua prova gratuita.

In questo articolo

  • Riepilogo
  • Abstract
  • Protocollo
  • Discussione
  • Divulgazioni
  • Riconoscimenti
  • Riferimenti
  • Ristampe e Autorizzazioni

Riepilogo

Visual analytics (VA) è un nuovo approccio di analisi dei dati in modo interattivo. In questo video si discute il problema di sovraccarico di dati causata da esperimenti biologici high-throughput, VA e proporre come soluzione a tale problema. Il video mostra l'analisi all'interno e tra le serie di dati immunologici usando uno strumento chiamato Tableau VA.

Abstract

Visual analytics (VA) è emerso come un nuovo modo di analizzare insieme di dati di grandi dimensioni attraverso interattivo di visualizzazione. Abbiamo dimostrato l'utilità e la flessibilità di un approccio VA nell'analisi dei set di dati biologici. Esempi di questi set di dati in immunologia comprendono citometria a flusso, i dati di Luminex, e la genotipizzazione (ad esempio, singolo polimorfismo del nucleotide) di dati. Contrariamente all'approccio tradizionale visualizzazione delle informazioni, VA ripristina la potenza di analisi nelle mani di analista, consentendo l'analista di impegnarsi in tempo reale processo di esplorazione dei dati. Abbiamo scelto il software VA chiamato Tableau dopo aver valutato diversi strumenti VA. Due tipi di attività di analisi di analisi all'interno e tra i set di dati sono state dimostrate nel video di presentazione con un approccio chiamato analisi associati. Analisi appaiati, come definito in VA, è un approccio di analisi in cui un esperto strumento VA lavora fianco a fianco con un esperto di dominio durante l'analisi. L'esperto di dominio è colui che capisce il significato dei dati, e pone le domande che i dati raccolti potrebbero affrontare. L'esperto strumento crea poi visualizzazioni per aiutare a trovare modelli nei dati che potrebbero rispondere a queste domande. Il breve intervallo di tempo tra la generazione di ipotesi e la visualizzazione rapida visiva dei dati è il principale vantaggio di un approccio VA.

Protocollo

1. Esplorazione a base di analisi su Tableau

  1. Hai un set di dati e si desidera esplorare le varie relazioni tra le colonne all'interno dei dati.
    1. (Figura 1) Importare il set di dati cliccando su 'Connect ai dati'. Scegliere il tipo di origine dati e seguire le istruzioni per importare i set di dati.
    2. (Figura 1) Verificare che la mensola dimensioni contiene colonne categorico, mentre la mensola misure contiene colonne numeriche dal set di dati. A volte una colonna dimensione come identificatore del soggetto possono essere elencati come misura se è numerata. Modificarlo in dimensioni facendo clic destro su di esso e scegliere 'Converti in Dimension'. Nella Figura 1, colonne categorico dal set di dati come il livello di concentrazione e stimolo identificatori soggetto sono correttamente collocati in scaffali dimensioni, e la concentrazione delle citochine osservate sono correttamente collocati in misure di ripiano.
    3. (Figura 2) Se durante il processo di analisi, un campo calcolato è necessario, basta fare clic destro in entrambe le dimensioni o misure di ripiano, e seleziona 'Crea campo calcolato'. Inserire il calcolo nella casella della formula con i campi e le numerose funzioni o operazioni matematiche. La figura 2 mostra come creare un nuovo campo chiamato PFD> 2 aggregando PFD2, PFD3 e PFD4 valori.
    4. (Figura 3) Generare un 2-D trama in Tableau, in genere con una dimensione e una misura di interesse. Poiché l'interfaccia offre semplice drag-and-drop interazione, la scelta della dimensione e misura può essere facilmente cambiata. Le dimensioni sono di solito collocati in scaffali colonne, e le misure di ripiano righe. Nella Figura 3, la mensola dimensioni contiene concentrazione a livello di stimolo, e la mensola contiene misure di livello osservato concentrazione delle citochine.
    5. (Figura 3) Per differenziare la visualizzazione di una dimensione specifica, posto che l'etichetta dimensione in scaffale testo, il colore o la dimensione, a seconda della natura della dimensione. Scaffale testo tentativi per differenziare i dati nella visualizzazione, mediante l'etichettatura con informazioni testuali fornite dal dimensione selezionata. Mensola a colori e le dimensioni automaticamente differenziare i dati per colore e dimensioni, che può essere regolato con la barra di scorrimento nella parte inferiore di ogni ripiano. In figura 3, ponendo genotipo a scaffale colore porta alla separazione di tre genotipi di colori distinti.
    6. (Figura 3) Filtrare la visualizzazione dalle variabili colonna specifica in altra dimensione. Questo può essere fatto trascinando l'etichetta dimensione nello scaffale filtro. Apparirà una finestra con l'elenco di valori tra cui scegliere. Il valore selezionato saranno gli unici valori rimasti nella visualizzazione.
    7. (Figura 4) Si può unire visualizzazione con altra dimensione o misura per la produzione di una matrice di visualizzazione. Questo può essere fatto facendo cadere più dimensioni in scaffale colonne, e le misure di ripiano in più righe. Figura 4 contiene un esempio di due colonne della matrice di visualizzazione mettendo due dimensioni diverse nello scaffale colonne.
    8. Per produrre una visualizzazione simile, fate clic destro sul foglio corrente sul basso a sinistra, e selezionate 'foglio duplicato'.
    9. Iterare il processo di analisi per identificare tendenze interessanti o valori anomali che possono aiutare a generare nuove ipotesi sui dati.
  2. Hai set di dati multipli generati dalla stessa fonte, e vogliono esplorare le possibili connessioni tra questi gruppi di dati.
    1. Luogo più set di dati in una stessa fonte, luogo cioè due fogli di calcolo nella stessa cartella di lavoro, per consentire Tableau di connettersi a questi set di dati attraverso la stessa connessione.
    2. (Figura 5) Collegare il set di dati attraverso la logica di unire valori chiave, facendo attenzione che le dimensioni che sono le stesse per più set di dati selezionati. Nella Figura 5, ci sono cinque valori chiave per unire: identificatore tipo di cellula, la concentrazione a livello di stimolo, la fase o gruppo, stimolo, e soggetto.
    3. Effettuare analisi simile alla sezione 1.1.

2. Presentazione a base di bisogni

  1. Sapete le relazioni tra dati, ma si vuole essere in grado di generare rapidamente un elenco di visualizzazioni per l'uso in presentazione.
    1. Seguire il protocollo di cui al punto 1.1, e annotare le visualizzazioni di conseguenza.
    2. Utilizzare la funzione di esportazione in Tableau per produrre immagini di visualizzazioni.
  2. Lei ha generato una serie di visualizzazioni potente nella cartella di lavoro Tableau e vogliono condividere tale cartella di lavoro.
    1. Salvare la cartella di lavoro come cartella di lavoro Tableau confezionati e condividere questo file.
    2. Colleghi senza Desktop Tableau Tableau Reader può essere scaricato per aprire la cartella di lavoro confezionato. Reader permette tableau tuoi colleghi di interagire con le visualizzazioni che hai creato.

3. RAPPRESENTANTE RISULTATI

figure-protocol-5369
Figura 1. Uno screenshotdi Tableau dopo l'importazione il foglio di calcolo chiamato NFKBIA dal demo.xls file di Excel. Le dimensioni e le mensole misure sono state opportunamente compilato con i dati categorici e numerici, rispettivamente.

figure-protocol-5730
Figura 2. La finestra di campo calcolato è invocato per creare un campo calcolato speciale da usare in Tableau. La lista in basso a sinistra della finestra consente di individuare possibili campi, e la lista sulla destra contiene un'abbreviazione di funzioni che possono essere utilizzati nella formula. In questo esempio, abbiamo voluto aggiungere i valori per PFD4, PFD3 e PFD2 per ottenere il valore finale che noi chiamiamo PFD> 2

figure-protocol-6285
Figura 3. Visualizzazione del livello di concentrazione stimolo contro la concentrazione delle citochine osservato. La visualizzazione mostra un grafico dei diversi livelli di concentrazione dello stimolo 3M-002 contro la concentrazione osservata della citochina TNF-α. I colori delle linee di consultare i genotipi differenti per un polimorfismo a singolo nucleotide nel gene NFKBIA degli individui nel nostro studio immunitario innato.

figure-protocol-6839
Figura 4. Uno screenshot di un due colonne della matrice di visualizzazione. Abbiamo generato una matrice a due colonne per facilitare un side-by-side di confronto delle risposte a due stimoli, 3M-003 e LPS. L'x-assi sono i diversi livelli di concentrazione dei due stimoli, e l'asse y trame i valori del campo calcolato, PFD> 2.

figure-protocol-7293
Figura 5. Tableau Queste finestre di dialogo illustrano come collegare i dati registrati in fogli di calcolo diversi. Connessione dati da fogli di calcolo che può essere svolto dalla combinazione di questi con logiche unire le clausole dei valori chiave.

Visualizzazione e strumento di analisi
Funzione Quadro VIS-STAMP xmdvtool GGobi Luce stellare Gapminder Visulab InfoVis Toolkit Geotime Ispirare
Grafici delle coordinate parallele No No No
Scatter plot matrici No No No No No
Riduzione dimensionale No No No No No No No No
Dimensioni temporali No No No
Geospaziali dimensioni No No No No No
Text mining No No No No No No No No
La manipolazione diretta dei dati No No
Filtraggio No
Estensibilità ad altre piattaforme (ad esempio, R) No No No No No
CSV tavolo formati No No No
Formati di dati XML No No No No
Sa muoversi con 10000 + file No No No No No No No
Documentazione
Prodotto commerciale No No No No No No

Tabella 1. Elenco degli strumenti di analisi visiva e alcune delle loro caratteristiche.

Access restricted. Please log in or start a trial to view this content.

Discussione

L'avvento della tecnologia high-throughput nella moderna ricerca biomedica portato a un'esplosione dei dati di ricerca che richiede un modo più efficiente di analisi. Visual analytics (VA) è la scienza del ragionamento analitico facilitato da interfacce visuali interattivi (1). L'approccio VA ripristina la potenza analitica nelle mani di analista umano, in contrasto con l'approccio tradizionale di individuare modelli di computer. Analisi visiva è stata applicata alla ricerca in vari campi, come la dif...

Access restricted. Please log in or start a trial to view this content.

Divulgazioni

Nessun conflitto di interessi dichiarati.

Riconoscimenti

Vorremmo ringraziare i membri di Vancouver Istituto di Visual Analytics (VIVA) per offrire commenti e consigli per il progetto. In particolare, vorremmo ringraziare John Dill, Brian Fisher e David Darvill. Vorremmo anche ringraziare i membri del laboratorio Kollmann per il sostegno e utili discussioni. Questo lavoro è stato sostenuto in parte dal National Institute of Allergy and Infectious Diseases, Istituto Superiore di Sanità di Grant N01 AI50023; Borse di NCE Allergen 07-07-A1A e B2B, e il Michael Smith Fondazione per la Ricerca Sanitaria. TRK è sostenuto in parte da un Premio alla carriera nella scienza biomedica dal annuncio Burroughs Wellcome Fondo da un Istituti canadesi per Grant formazione per la ricerca in sanità canadese Health Program Scientist Bambino Clinico, in collaborazione con Sick-Kids Foundation, Child and Family Research Institute ( British Columbia), Donne e salute dei bambini Research Institute (Alberta), e Manitoba Institute of Child Health.

Access restricted. Please log in or start a trial to view this content.

Riferimenti

  1. Thomas, J., Cook, K. Illuminating the Path: The Research and Development Agenda for Visual Analytics. , IEEE CS Press. (2005).
  2. Steed, C., Swan, J., Jankun-Kelly, T., Fitzpatrick, P. Guided Analysis of Hurricane Trends Using Statistical Processes Integrated with Interactive Parallel Coordinates. IEEE Symposium on Visual Analytics Science and Technology. , IEEE. Atlantic City. 19-26 (2009).
  3. Saraiya, P., North, C., Lam, V., Duca, K. An Insight-Based Longitudinal Study of Visual Analytics. IEEE Transactions on Visualization and Computer Graphics. 12, 1511-1522 (2006).
  4. Kollmann, T. R., Crabtree, J., Rein-Weston, A., Blimkie, D., Thommai, F., Wang, X. Y., Lavoie, P. M., Furlong, J., Fortuno, E. S. 3rd, Hajjar, A. M., Hawkins, N. R., Self, S. G., Wilson, C. B. Neonatal innate TLR-mediated responses are distinct from those of adults. J. Immunol. 183, 7150-7160 (2009).

Access restricted. Please log in or start a trial to view this content.

Ristampe e Autorizzazioni

Richiedi autorizzazione per utilizzare il testo o le figure di questo articolo JoVE

Richiedi Autorizzazione

Esplora altri articoli

ImmunologiaNumero 47analisi visualecitometria a flussoLuminexTableaucitochinel immunit innatasingolo polimorfismo del nucleotide

This article has been published

Video Coming Soon

JoVE Logo

Riservatezza

Condizioni di utilizzo

Politiche

Ricerca

Didattica

CHI SIAMO

Copyright © 2025 MyJoVE Corporation. Tutti i diritti riservati