JoVE Logo

Anmelden

Zum Anzeigen dieser Inhalte ist ein JoVE-Abonnement erforderlich. Melden Sie sich an oder starten Sie Ihre kostenlose Testversion.

In diesem Artikel

  • Zusammenfassung
  • Zusammenfassung
  • Protokoll
  • Diskussion
  • Offenlegungen
  • Danksagungen
  • Referenzen
  • Nachdrucke und Genehmigungen

Zusammenfassung

Visual Analytics (VA) ist ein neuer Ansatz zur Analyse von Daten interaktiv. In diesem Video sprechen wir die Daten Überlastung Problem durch High-Throughput-biologische Experimente gebracht werden, und schlagen VA als eine Lösung für dieses Problem nicht. Das Video demonstriert Analyse innerhalb und zwischen den immunologischen Datensätze mit einem VA-Tool namens Tableau.

Zusammenfassung

Visual Analytics (VA) hat als einen neuen Weg, um große Datensätze durch interaktive Visualisierung analysieren entstanden. Wir zeigten den Nutzen und die Flexibilität eines VA-Ansatz in der Analyse von biologischen Datensätzen. Beispiele für diese Datensätze in der Immunologie zählen Durchflusszytometrie, Luminex Daten und Genotypisierung (zB Single-Nukleotid-Polymorphismus)-Daten. Im Gegensatz zu den traditionellen Informationsvisualisierung Ansatz, stellt die Analyse VA Macht in den Händen von Analysten, indem der Analytiker in Echtzeit Daten Exploration Prozess zu engagieren. Wir haben uns für die VA Software namens Tableau nach der Auswertung mehrerer VA-Tools. Zwei Arten der Analyse Aufgaben Analyse innerhalb und zwischen den Datensätzen wurden in der Video-Präsentation mit einem Ansatz namens gepaart Analyse nachgewiesen. Gepaart Analyse, wie in VA definiert, ist eine Analyse-Ansatz, in dem ein VA-Tool-Experte arbeitet Seite an Seite mit einem Domain-Experte bei der Analyse. Die Domain-Experte ist derjenige, der die Bedeutung der Daten versteht, und stellt die Fragen, die die gesammelten Daten könnten Adresse. Das Tool-Experte erstellt dann Visualisierungen zu helfen, finden Sie Muster in den Daten, die diese Fragen beantworten könnte. Die kurze Verzögerungszeit zwischen der Hypothese Generation und die schnelle visuelle Darstellung der Daten ist der Hauptvorteil eines VA-Ansatz.

Protokoll

1. Exploration-based Analysis auf Tableau

  1. Sie haben einen Datensatz, und Sie möchten die verschiedenen Beziehungen zwischen den Spalten in den Daten zu entdecken.
    1. (Abbildung 1) Import des Datensatzes durch einen Klick auf "Daten Connect '. Wählen Sie den Typ der Datenquelle und folgen Sie den Anweisungen auf Ihrem Datensatz zu importieren.
    2. (Abbildung 1) Stellen Sie sicher, dass die Abmessungen Regal kategorische Spalten enthält, während die Maßnahmen Regal enthält numerische Spalten aus Ihrem Datenbestand. Manchmal ist eine Dimension Spalte, z. B. Thema Kennung kann als Maßnahme aufgeführt werden, wenn sie nummeriert. Ändern Sie die Abmessungen mit der rechten Maustaste darauf und wählen "Convert to Dimension". In Abbildung 1 sind kategorische Spalten aus dem Datensatz wie etwa Stimulus Konzentration und unterliegen Identifikatoren korrekt in Dimensionen Regal gestellt, und die beobachtete Konzentration der Zytokine sind korrekt in Maßnahmen Regal gestellt.
    3. (Abbildung 2) Wenn bei der Analyse-Prozess, ein berechnetes Feld benötigt wird, einfach mit der rechten in beiden Dimensionen oder Maßnahmen Regal klicken, und wählen Sie "Create Berechnetes Feld". Geben Sie die Berechnung in der Formel-Box mit Feldern mit Funktionen oder mathematische Operationen kombiniert. Abbildung 2 zeigt, wie man ein neues Feld namens PFD> 2 durch Aggregation PFD2, PFD3 und PFD4 Werte zu schaffen.
    4. (Abbildung 3) Erzeugen Sie eine 2-D Plot in Tableau, in der Regel mit einer Dimension und ein gewisses Maß an Interesse. Da die Schnittstelle bietet eine einfache Drag-and-Drop-Interaktion, kann die Wahl der Dimension und messen leicht geändert werden. Die Abmessungen sind in der Regel in Spalten Regal, und Maßnahmen in den Reihen Regal gestellt. In Abbildung 3 enthält die Abmessungen Regal Stimulus Konzentration, und die Maßnahmen Regal enthält beobachtet Konzentration von Zytokinen.
    5. (Abbildung 3) Um die Visualisierung durch eine spezifische Dimension, statt zu differenzieren, dass Bemassungstext in Text, Farbe oder Größe Regal, je nach Art der Dimension. Text Regal versucht, Daten in die Visualisierung durch Etikettierung sie mit Textinformationen durch die Dimension ausgewählt vorgesehen unterscheiden. Farbe und Größe Regal wird automatisch unterschieden Daten nach Farbe und Größe, die mit dem Scroll-Leiste am unteren Rand jeder Regal befindet eingestellt werden kann. In Abbildung 3, indem Genotyp in Farbe Regal führt zur Trennung der drei Genotypen durch verschiedene Farben.
    6. (Abbildung 3) Filter die Visualisierung durch die spezifische Spalte Variablen in anderen Dimensionen. Dies kann durch Ziehen der Dimension Label in den Filter Regal durchgeführt werden. Es wird ein Fenster mit der Liste der Werte zur Auswahl angezeigt. Der gewählte Wert wird nur blieben die Werte in der Visualisierung.
    7. (Abbildung 4) können Sie die Visualisierung mit anderen Dimension zu kombinieren oder zu messen, um eine Matrix der Visualisierung zu erzeugen. Dies kann durch Fallenlassen mehreren Dimensionen in den Spalten Regal, und mehrere Maßnahmen in Reihen Regal durchgeführt werden. Abbildung 4 enthält ein Beispiel für Zwei-Säulen-Visualisierung Matrix, indem Sie zwei unterschiedliche Dimensionen in den Spalten Regal.
    8. Um eine vergleichbare Darstellung, direkt an der aktuellen Tabelle auf der linken unteren Ecke klicken, und ausgewählte "Duplikat Blatt".
    9. Iterate den Analyseprozess zu interessanten Trends und Ausreißer, die Ihnen helfen zu generieren neue Hypothese über die Daten zu identifizieren.
  2. Sie haben mehrere Datensatz aus der gleichen Quelle erzeugt wird, und wollen die möglichen Verbindungen zwischen diesen Datensätzen zu entdecken.
    1. Legen Sie mehrere Datensätze in einer gleichen Quelle, dh Platz zwei Tabellen in derselben Arbeitsmappe, damit Tableau, auf diese Datenmenge durch die gleiche Verbindung zu verbinden.
    2. (Abbildung 5) Schließen Sie die Datensätze durch logische Verknüpfung der zentralen Werte, um sicherzustellen, dass die Dimensionen, die das gleiche für mehrere Datensätze ausgewählt werden. In Abbildung 5 gibt es fünf zentrale Werte für den Beitritt: Zelltyp, Stimulus Konzentration, Bühne oder Gruppe, Reiz und vorbehaltlich Kennung.
    3. Durchführen von Analysen ähnlich Abschnitt 1.1.

2. Presentation-based Needs

  1. Sie kennen die Beziehungen zwischen Daten, aber Sie wollen in der Lage sein, schnell eine Liste von Visualisierungen für den Einsatz in der Präsentation.
    1. Follow-Protokoll in Abschnitt 1.1 beschrieben, und kommentieren Sie die Visualisierungen entsprechend.
    2. Verwenden Sie die Export-Funktion in Tableau von Bildern von Visualisierungen zu produzieren.
  2. Sie haben einen mächtigen Satz von Visualisierungen in Tableau Arbeitsmappe erstellt und möchte, dass Arbeitsmappe freigeben.
    1. Speichern Sie die Arbeitsmappe als Tableau verpackt Arbeitsmappe und teilen Sie diese Datei.
    2. Kollegen ohne Tableau Desktop kann download Tableau Reader, um die verpackten Arbeitsmappe öffnen. Tableau Reader ermöglicht Ihren Mitarbeitern, mit den Visualisierungen, die Sie erstellt haben, zu interagieren.

3. Repräsentative Ergebnisse

figure-protocol-5428
Abbildung 1. Ein Screenshotvon Tableau nach dem Import der Tabellenkalkulation namens NFKBIA aus der Excel-Datei demo.xls. Die Dimensionen und Kennzahlen Regale waren richtig mit dem kategorischen und numerischen Daten gefüllt, bzw..

figure-protocol-5781
Abbildung 2. Berechneten Feld Fenster wird aufgerufen, um ein spezielles berechnetes Feld erstellen, um in Tableau verwenden. Die Liste auf der linken unteren Feld hilft bei der Identifizierung möglichen Bereichen, und die Liste auf der rechten Seite enthält Abkürzung von Funktionen, die in der Formel verwendet werden können. In diesem Beispiel wollten wir die Werte für PFD4, PFD3 und PFD2 hinzufügen, um den endgültigen Wert, dass wir als PFD> 2 erhalten

figure-protocol-6359
Abbildung 3. Visualisierung von Stimulus Konzentration vs beobachtet Zytokin-Konzentration. Die Visualisierung zeigt eine grafische Darstellung der verschiedenen Konzentrationen des Stimulus 3M-002 gegen die beobachtete Konzentration der Zytokine TNF-α. Die Farben der Linien beziehen sich auf die unterschiedlichen Genotypen für eine Single-Nukleotid-Polymorphismus im Gen NFKBIA der Individuen in unserer angeborenen Immunsystems zu untersuchen.

figure-protocol-6926
Abbildung 4. Ein Screenshot von einer Zwei-Säulen-Visualisierung Matrix. Wir erzeugten eine Zwei-Säulen-Matrix zu einem Side-by-Side-Vergleich der Antworten auf zwei Reize, 3M-003 und LPS zu erleichtern. Die x-Achse sind die verschiedenen Konzentrationen der beiden Reize, und die y-Achse zeigt die Werte des berechneten Feldes, PFD> 2.

figure-protocol-7382
Abbildung 5. Diese Tableau Dialog-Fenster zeigen, wie die Daten in verschiedenen Tabellen aufgenommen zu verbinden. Einbinden von Daten aus verschiedenen Tabellen können durch die Kombination dieser mit logischen Join-Klauseln der wichtigsten Werte erreicht werden.

Visualisierung und Analyse-Tool
Funktion Bild VIS-STAMP xmdvtool Ggobi Sternenlicht Gapminder Visulab InfoVis Toolkit Geotime Inspirieren
Parallel zu koordinieren Grundstücke Ja Ja Ja Ja Ja Nicht Ja Ja Nicht Nicht
Streudiagramm-Matrizen Ja Nicht Ja Ja Ja Nicht Ja Nicht Nicht Nicht
Dimensional Reduktion Nicht Nicht Ja Ja Nicht Nicht Nicht Nicht Nicht Nicht
Zeitlichen Dimensionen Ja Ja Nicht Ja Ja Ja Nicht Ja Ja Nicht
Geospatial Dimensionen Ja Ja Nicht Nicht Ja Ja Nicht Nicht Ja Nicht
Text-Mining Nicht Nicht Nicht Nicht Ja Nicht Nicht Nicht Nicht Ja
Die direkte Manipulation von Daten Ja Ja Ja Ja Ja Ja Ja Nicht Ja Nicht
Filtering Ja Ja Ja Ja Ja Ja Ja Nicht Ja Ja
Erweiterbarkeit auf andere Plattformen (zB R) Ja Nicht Ja Ja Nicht Ja Nicht Ja Nicht Nicht
CSV-Tabelle Formate Ja Ja Ja Ja Nicht Nicht Ja Ja Ja Nicht
XML-Datenformate Ja Nicht Nicht Ja Ja Nicht Ja Ja Ja Nicht
Kann mit 1 Deal0000 + Zeilen Ja Nicht Nicht Nicht Ja Nicht Nicht Nicht Nicht Ja
Dokumentation Ja Ja Ja Ja Ja Ja Ja Ja Ja Ja
Kommerzielles Produkt Ja Nicht Nicht Nicht Ja Nicht Nicht Nicht Ja Ja

Tabelle 1. Liste der Visual Analytics-Tools und einige ihrer Funktionen.

Access restricted. Please log in or start a trial to view this content.

Diskussion

Das Aufkommen von High-Throughput-Technologien in der modernen biomedizinischen Forschung führte zu einer Explosion der Forschung Daten, die eine effizientere Methode zur Analyse erfordert. Visual Analytics (VA) ist die Wissenschaft der analytischen Argumentation interaktiven visuellen Schnittstellen (1) erleichtert. Die VA-Ansatz stellt die analytische Kraft in den Händen der Menschen Analyst, im Gegensatz zu den traditionellen Ansatz, um Muster von Computer zu erkennen. Visual Analytics hat Forschung in verschiedene...

Access restricted. Please log in or start a trial to view this content.

Offenlegungen

Keine Interessenskonflikte erklärt.

Danksagungen

Wir möchten die Mitglieder des Vancouver Institute of Visual Analytics (VIVA) für das Anbieten Kommentare und Ratschläge für das Projekt danken. Insbesondere möchten wir John Dill, Brian Fisher, und David Darvill danken. Wir möchten auch die Mitglieder des Kollmann Labor für ihre Unterstützung und hilfreiche Diskussionen danken. Diese Arbeit wurde teilweise durch National Institute of Allergy and Infectious Diseases, National Institute of Health Grants N01 AI50023 unterstützt; Allergen NCE Grants 07-A1A und 07-B2B, und die Michael Smith Foundation for Health Research. TRK ist zum Teil durch ein Career Award in der Biomedical Science an der Burroughs Wellcome Fund einer Anzeige von einer kanadischen Institute for Health Research Training Grant in kanadischen Child Health Clinician Scientist Program, in Zusammenarbeit mit Sick-Kids-Stiftung, Kinder-und Family Research Institute unterstützt ( British Columbia), Frauen und Kinder Health Research Institute (Alberta) und Manitoba Institute of Child Health.

Access restricted. Please log in or start a trial to view this content.

Referenzen

  1. Thomas, J., Cook, K. Illuminating the Path: The Research and Development Agenda for Visual Analytics. , IEEE CS Press. (2005).
  2. Steed, C., Swan, J., Jankun-Kelly, T., Fitzpatrick, P. Guided Analysis of Hurricane Trends Using Statistical Processes Integrated with Interactive Parallel Coordinates. IEEE Symposium on Visual Analytics Science and Technology. , IEEE. Atlantic City. 19-26 (2009).
  3. Saraiya, P., North, C., Lam, V., Duca, K. An Insight-Based Longitudinal Study of Visual Analytics. IEEE Transactions on Visualization and Computer Graphics. 12, 1511-1522 (2006).
  4. Kollmann, T. R., Crabtree, J., Rein-Weston, A., Blimkie, D., Thommai, F., Wang, X. Y., Lavoie, P. M., Furlong, J., Fortuno, E. S. 3rd, Hajjar, A. M., Hawkins, N. R., Self, S. G., Wilson, C. B. Neonatal innate TLR-mediated responses are distinct from those of adults. J. Immunol. 183, 7150-7160 (2009).

Access restricted. Please log in or start a trial to view this content.

Nachdrucke und Genehmigungen

Genehmigung beantragen, um den Text oder die Abbildungen dieses JoVE-Artikels zu verwenden

Genehmigung beantragen

Weitere Artikel entdecken

ImmunologieVisual AnalyticsDurchflusszytometrieLuminexTableauZytokinangeborene Immunit tEinzel Nukleotid Polymorphismus

This article has been published

Video Coming Soon

JoVE Logo

Datenschutz

Nutzungsbedingungen

Richtlinien

Forschung

Lehre

ÜBER JoVE

Copyright © 2025 MyJoVE Corporation. Alle Rechte vorbehalten