Zum Anzeigen dieser Inhalte ist ein JoVE-Abonnement erforderlich. Melden Sie sich an oder starten Sie Ihre kostenlose Testversion.
Wir haben eine einfache, anpassbare und effiziente Methode entwickelt, um quantitative Prozessdaten aus interaktiven räumlichen Aufgaben zu erfassen und diese Rotationsdaten mit Eye-Tracking-Daten abzubilden.
Wir stellen eine Methode zur Echtzeitaufzeichnung menschlicher Interaktion mit dreidimensionalen (3D) virtuellen Objekten vor. Der Ansatz besteht darin, Rotationsdaten des manipulierten Objekts mit Verhaltensmaßstäben wie Eye-Tracking zu verknüpfen, um bessere Rückschlüsse auf die zugrunde liegenden kognitiven Prozesse zu ziehen.
Die Aufgabe besteht darin, zwei identische Modelle desselben 3D-Objekts (eines Moleküls) auf einem Computerbildschirm darzustellen: ein rotierendes, interaktives Objekt (iObj) und ein statisches Zielobjekt (tObj). Die Teilnehmer müssen iObj mit der Maus drehen, bis sie der Meinung sind, dass die Ausrichtung mit der von tObj identisch ist. Der Computer verfolgt alle Interaktionsdaten in Echtzeit. Auch die Blickdaten des Teilnehmers werden mit Hilfe eines Eyetrackers erfasst. Die Messfrequenz beträgt 10 Hz am Computer und 60 Hz am Eyetracker.
Die Orientierungsdaten von iObj in Bezug auf tObj werden in Rotationsquaternionen aufgezeichnet. Die Anvisiertdaten werden mit der Ausrichtung von iObj synchronisiert und mit demselben System referenziert. Diese Methode ermöglicht es uns, die folgenden Visualisierungen des menschlichen Interaktionsprozesses mit iObj und tObj zu erhalten: (1) Winkeldisparität, synchronisiert mit anderen zeitabhängigen Daten; (2) 3D-Rotationsbahn innerhalb dessen, was wir als "Ball der Rotationen" bezeichnen; (3) 3D-Fixierungs-Heatmap. Alle Schritte des Protokolls haben freie Software wie GNU Octave und Jmol verwendet, und alle Skripte stehen als ergänzendes Material zur Verfügung.
Mit diesem Ansatz können wir detaillierte quantitative Studien über den Prozess der Aufgabenlösung durchführen, der mentale oder physische Rotationen beinhaltet, und nicht nur über das erreichte Ergebnis. Es ist möglich, genau zu messen, wie wichtig jeder Teil der 3D-Modelle für den Teilnehmer bei der Lösung von Aufgaben ist, und so die Modelle mit relevanten Variablen wie den Eigenschaften der Objekte, den kognitiven Fähigkeiten der Individuen und den Eigenschaften der Mensch-Maschine-Schnittstelle in Beziehung zu setzen.
Mentale Rotation (MR) ist eine kognitive Fähigkeit, die es Individuen ermöglicht, Objekte mental zu manipulieren und zu drehen, was ein besseres Verständnis ihrer Merkmale und räumlichen Beziehungen ermöglicht. Es handelt sich um eine der visuell-räumlichen Fähigkeiten, einer grundlegenden kognitiven Gruppe, die bereits 1890 untersuchtwurde. Visuell-räumliche Fähigkeiten sind ein wichtiger Bestandteil des kognitiven Repertoires eines Individuums, das sowohl von vererbten als auch von Umweltfaktoren beeinflusst wird 2,3,4,5. Das Interesse an visuell-räumlichen Fähigkeiten hat im Laufe des 20. Jahrhunderts zugenommen, da sich die Beweise für ihre Bedeutung in Schlüsselfächern wie Alter6 und Entwicklung7, Leistung in Mathematik, Informatik, Naturwissenschaften und Technik (MINT)8,9, Kreativität10 und evolutionäre Merkmale11 häufen.
Die zeitgenössische Idee der MR leitet sich aus der Pionierarbeit von Shepard und Metzler (SM) aus dem Jahr 197112 ab. Sie entwickelten eine chronometrische Methode mit einer Reihe von "gleichen oder unterschiedlichen" Aufgaben, die zwei Projektionen abstrakter 3D-Objekte präsentierten, die nebeneinander angezeigt wurden. Die Teilnehmer mussten die Objekte mental um eine bestimmte Achse drehen und entscheiden, ob diese Projektionen das gleiche Objekt anders drehten oder unterschiedliche Objekte darstellten. Die Studie zeigte eine positive lineare Korrelation zwischen der Reaktionszeit (RT) und der Winkeldisparität (AD) zwischen Repräsentationen desselben Objekts. Diese Korrelation wird als Winkeldisparitätseffekt (ADE) bezeichnet. ADE wird als Verhaltensmanifestation der MR angesehen und wurde in mehreren einflussreichen nachfolgenden Studien auf diesem Gebiet allgegenwärtig 13,14,15,16,17,18,19,20,21,22,23,24,25. Die 3D-Objekte, die in der SM-Studie verwendet wurden, bestanden aus 10 zusammenhängenden Würfeln, die von dem Computergraphen-Pionier Michael Noll in den Bell Laboratories26 erzeugt wurden. Sie werden als SM-Zahlen bezeichnet und sind in MRT-Studien weit verbreitet.
Zwei Fortschritte waren in Shepards und Metzlers bahnbrechender Arbeit von großer Bedeutung; erstens, unter Berücksichtigung der Beiträge auf dem Gebiet der MR-Bewertungen. Im Jahr 1978 entwickelten Vanderberg und Kuze27 einen psychometrischen Bleistift-und-Papier-Test mit 20 Punkten, der auf SM-Zahlen "gleich oder unterschiedlich" basierte, der als mentaler Rotationstest (VKMRT) bekannt wurde. Jeder Testgegenstand stellt einen Zielreiz dar. Die Teilnehmer müssen unter vier Stimuli auswählen, welche das gleiche Objekt repräsentieren, das im Zielstimulus dargestellt wird, und welche nicht. VKMRT wurde verwendet, um die Korrelation zwischen MR-Fähigkeit und verschiedenen anderen Faktoren zu untersuchen, wie z.B. geschlechtsbezogene Unterschiede 6,21,24,28,29,30, Altern und Entwicklung 6,31,32, akademische Leistung8,33, und Fähigkeiten in Musik und Sport34. 1995 veröffentlichten Peters et al. eine Studie mit neu gezeichneten Zahlen für die VKMRT35,36. In ähnlicher Weise wurden nach dem "gleichen oder unterschiedlichen" Aufgabendesign eine Vielzahl anderer Bibliotheken computergenerierter Stimuli eingesetzt, um MR-Prozesse zu untersuchen und MR-Fähigkeiten zu bewerten (3D-Versionen der ursprünglichen SM-Stimuli 19,22,23,37,38, menschlicher Körper, der SM-Figurennachahmt 25,39,40, flache Polygone für die 2D-Rotation 41, 42, Anatomie und Organe43, organische Formen44, Moleküle45,46 u.a.21). Der von Guay 1976 vorgeschlagene Purdue Spatial Visualization Test (PSVT)47 ist ebenfalls relevant. Es beinhaltet eine Reihe von Tests, einschließlich MR (PSVT:R). PSVT:R verwendet andere Stimuli als in der VKMRT und verlangt von den Teilnehmern, eine Rotationsoperation in einem Modellstimulus zu identifizieren und sie mental auf einen anderen anzuwenden. PSVT:R ist ebenfalls weit verbreitet, insbesondere in Studien, die die Rolle der MR bei der MINT-Leistung untersuchen 48,49,50.
Der zweite Fortschritt, der in der bahnbrechenden Arbeit von Shepard und Metzler von großer Bedeutung ist, umfasst die Beiträge zum Verständnis des MRT-Prozesses, insbesondere mit dem Einsatz von Eye-Tracking-Geräten. Im Jahr 1976 verwendeten Just und Carpenter14 analoge videobasierte Eye-Tracking-Geräte, um eine Studie durchzuführen, die auf dem ADE-Experiment von Shepard und Metzler basierte. Aus ihren Ergebnissen zu sakkadischen Augenbewegungen und RTs schlugen sie ein Modell von MRT-Prozessen vor, das aus drei Phasen besteht: 1) der Suchphase, in der ähnliche Teile der Figuren erkannt werden; 2) die Transformations- und Vergleichsphase, in der einer der identifizierten Teile gedanklich gedreht wird; 3) die Bestätigungsphase, in der entschieden wird, ob die Zahlen gleich sind oder nicht. Die Phasen werden rekursiv wiederholt, bis eine Entscheidung getroffen werden kann. Jeder Schritt entspricht spezifischen sakkadischen und fixativen Augenbewegungsmustern in enger Beziehung zu den beobachteten ADEs. Durch die Korrelation der Augenaktivität mit chronometrischen Daten lieferten Just und Carpenter eine kognitive Signatur für die Untersuchung von MR-Prozessen. Bisher wurde dieses Modell, wenn auch mit Anpassungen, in mehreren Studien übernommen 15,42,46,51,52,53.
Diesem Pfad folgend, wurden mehrere nachfolgende Studien zur Überwachung des Verhaltens 18,19,22,23,25,34,40,54,55 und der Gehirnaktivität 20,22,56,57 Funktionen während der Stimulirotation wurden durchgeführt. Ihre Ergebnisse deuten auf eine kooperative Rolle zwischen MR und motorischen Prozessen hin. Darüber hinaus besteht ein wachsendes Interesse an der Untersuchung von Problemlösungsstrategien mit MR in Bezug auf individuelle Unterschiede 15,41,46,51,58.
Insgesamt kann davon ausgegangen werden, dass das Design von Studien zum Verständnis von MRT-Prozessen darauf basiert, eine Aufgabe mit visuellen Reizen zu präsentieren, die die Teilnehmer auffordert, eine MRT-Operation durchzuführen, die wiederum eine motorische Reaktion nach sich zieht. Wenn diese Reaktion eine Rotation der Reize ermöglicht, wird sie oft als physikalische Rotation (PR) bezeichnet. Abhängig von den spezifischen Zielen der jeweiligen Studie wurden unterschiedliche Strategien und Geräte zur Datenerfassung und -analyse von MR und PR eingesetzt. Im Schritt der Präsentation von Aufgabenreizen ist es möglich, die Arten von Reizen zu ändern (d. h. die zuvor zitierten Beispiele); die Projektion (computergenerierte Bilder in herkömmlichen Displays 22,23,25,29,40,41,59 sowie in Stereoskopen19 und virtuellen60 und gemischten43 Realitätsumgebungen); und die Interaktivität der Reize (statische Bilder 12,27,36, Animationen 61 und interaktive virtuelle Objekte 19,22,23,43,53,59).
Die MR wird in der Regel aus Messungen der RTs (ADE) sowie der Augen- und Gehirnaktivität abgeleitet 25,46,62. Die Messung der Augenaktivität erfolgt anhand von Eye-Tracking-Daten, die aus sakkadischen Bewegungen und Fixationen 14,15,42,51,52,54,58,60 sowie Pupillometrie40 bestehen. RT-Daten ergeben sich typischerweise aus Motorreaktionsdaten, die während der Betätigung verschiedener Geräte aufgezeichnet werden, wie z. B. Hebel13, Tasten und Schalter14, 53, Pedale53, Drehknöpfe19, Joysticks37, Tastatur61 und Maus29, 58, 60 Antriebsräder53, Inertialsensoren22, 53, Touchscreens52, 59und Mikrofone22. Um die PR zu messen, wird das Studiendesign zusätzlich zu den RTs auch die Aufzeichnung manueller Rotationen interaktiver Stimuli umfassen, während die Teilnehmer die MR-Aufgabe 22,23,52,53 ausführen.
Im Jahr 1998 verwendeten Wohlschläger und Wohlschläger19 "gleiche oder verschiedene" Aufgaben mit interaktiven virtuellen SM-Stimuli, die mit einem Knopf manipuliert wurden, wobei die Rotationen auf eine Achse pro Aufgabe beschränkt waren. Sie maßen die RT und die kumulative Aufzeichnung der körperlichen Rotationen, die während der Aufgaben durchgeführt wurden. Durch den Vergleich von Situationen mit und ohne tatsächliche Rotation der interaktiven Stimuli kamen sie zu dem Schluss, dass MR und PR einen gemeinsamen Prozess sowohl für imaginierte als auch für tatsächlich durchgeführte Rotationen haben.
Im Jahr 2014 wurden zwei Studien durchgeführt, in denen die gleiche Art von Aufgaben mit virtuellen interaktiven Reizen verwendetwurden 22,23. Die Objekte wurden jedoch mit Inertialsensoren manipuliert, die Bewegungen im 3D-Raum erfassten. In beiden Fällen wurden zusätzlich zu den RTs auch Rotationstrajektorien aufgezeichnet - die Entwicklung der Rotationsunterschiede zwischen Referenz- und interaktiven Stimuli während der Aufgaben. Aus diesen Trajektorien war es möglich, sowohl kumulative Informationen (d.h. die Gesamtzahl der Umdrehungen in quaternionischen Einheiten) als auch detaillierte Informationen über Lösungsstrategien zu extrahieren. Adams et al.23 untersuchten den kooperativen Effekt zwischen MR und PR. Zusätzlich zu den RTs verwendeten sie das Integral der Rotationstrajektorien als Parameter für die Genauigkeit und Objektivität der Auflösung. Die Interpretation der Kurvenprofile erfolgte nach einem dreistufigen Modell63 (Planung, große Umdrehung, Feinjustierung). Die Ergebnisse deuten darauf hin, dass MR und PR nicht notwendigerweise einen einzigen, gemeinsamen Faktor haben. Gardony et al.22 sammelten Daten zu RT, Genauigkeit und Echtzeitrotation. Die Analyse der Rotationstrajektorien bestätigte nicht nur den Zusammenhang zwischen MR und PR, sondern zeigte auch, dass die Teilnehmer die Zahlen so lange manipulierten, bis sie erkennen konnten, ob sie unterschiedlich waren oder nicht. Wenn sie gleich waren, drehten die Teilnehmer sie, bis sie gleich aussahen.
Um diese Strategie fortzusetzen, setzten Wetzel und Bertel52 im Jahr 2018 auch interaktive SM-Figuren bei "gleichen oder unterschiedlichen" Aufgaben mit Touchscreen-Tablets als Schnittstelle ein. Darüber hinaus verwendeten sie ein Eye-Tracking-Gerät, um kumulative Daten zur Fixationszeit und zur sakkadischen Amplitude als Parameter der kognitiven Belastung bei der Lösung von MRT-Aufgaben zu erhalten. Die Autoren bestätigten die oben diskutierten Studien zu den Zusammenhängen zwischen MR und PR und den Aufgabenlösungsprozessen. In dieser Studie verwendeten sie jedoch keine Fixationskartierungs- und Sakkadendaten für die Stimuli.
Methodische Ansätze für die Kartierung von Eye-Tracking-Daten über virtuelle 3D-Objekte wurden vorgeschlagen und ständig verbessert, häufig von Forschern, die daran interessiert sind, die Faktoren im Zusammenhang mit der visuellen Aufmerksamkeit in virtuellen Umgebungen zu untersuchen64. Obwohl diese Methoden erschwinglich sind und ähnliche Eye-Tracking-Geräte verwenden, wurden sie anscheinend nicht effektiv in das experimentelle Repertoire integriert, das in mentalen Rotationsstudien mit interaktiven 3D-Objekten wie den zuvor erwähnten verwendet wird. Umgekehrt fanden wir in der Literatur keine Studien, die über eine Echtzeit-Kartierung von Fixations- und Sakkadenbewegungsdaten auf interaktiven 3D-Objekten berichten. Es scheint keine bequeme Methode zu geben, um Augenaktivitätsdaten einfach in Rotationsverläufe zu integrieren. Mit dieser Forschung wollen wir dazu beitragen, diese Lücke zu schließen. Das Vorgehen wird von der Datenerfassung bis zur grafischen Ausgabegenerierung detailliert dargestellt.
In diesem Artikel beschreiben wir detailliert eine Methode zur Untersuchung mentaler Rotationsprozesse mit virtuellen interaktiven 3D-Objekten. Die folgenden Fortschritte sind hervorgehoben. Zunächst integriert es die quantitative verhaltensmotorische (handgesteuerte Objektdrehung über eine Computerschnittstelle) und die okuläre (Eye-Tracking) Datenerfassung während Interaktionssitzungen mit virtuellen 3D-Modellen. Zweitens werden nur herkömmliche Computergeräte und Eye-Tracking-Geräte für die Gestaltung visueller Aufgaben, die Datenerfassung, die Aufzeichnung und die Verarbeitung benötigt. Drittens generiert es auf einfache Weise eine grafische Ausgabe, um die Datenanalyse zu erleichtern - Winkeldisparität, physikalische Rotation, quaternionische Rotationstrajektorien und Hit-Mapping von Eye-Tracking-Daten über virtuelle 3D-Objekte. Schließlich erfordert die Methode nur freie Software. Alle entwickelten Codes und Skripte stehen kostenlos zur Verfügung (https://github.com/rodrigocnstest/rodrigocnstest.github.io).
1. Vorbereitung von Datenerhebungsinstrumenten
2. Datenerhebung
3. Datenverarbeitung und -analyse
4. Anpassung der Aufgabe
HINWEIS: Dieser gesamte Abschnitt ist optional und wird nur für diejenigen empfohlen, die gerne experimentieren oder verstehen, wie man programmiert. Im Folgenden finden Sie einige der vielen anpassbaren Optionen, die verfügbar sind, und weitere Optionen werden verfügbar werden, wenn wir die Methoden weiterentwickeln.
Entwicklung der Winkeldisparität und anderer Variablen
Wie in Schritt 3.3.1 in der Zusatzdatei 2 dargestellt, werden dem Teilnehmer auf dem Videomonitorbildschirm zwei Leinwände präsentiert, auf denen Kopien desselben virtuellen 3D-Objekts in unterschiedlichen Ausrichtungen angezeigt werden. Auf der linken Leinwand bleibt das Zielobjekt (tObj) statisch und dient als Zielposition oder tObj-Position. Auf der rechten Leinwand wird das...
Wie bereits erwähnt, zielt dieses Papier darauf ab, ein detailliertes Verfahren zur Echtzeit-Kartierung von Fixations- und Sakkadenbewegungsdaten auf interaktiven 3D-Objekten vorzustellen, das leicht anpassbar ist und nur kostenlos verfügbare Software verwendet und Schritt-für-Schritt-Anweisungen bietet, damit alles funktioniert.
Während dieser Versuchsaufbau eine hochgradig interaktive Aufgabe beinhaltete, wie z. B. das Verschieben eines 3D-Objekts, um di...
Die Autoren haben keine Interessenkonflikte offenzulegen.
Die Autoren danken der Coordination for the Improvement of Higher Education Personnel (CAPES) - Finance Code 001 und der Federal University of ABC (UFABC). João R. Sato erhielt finanzielle Unterstützung von der Forschungsstiftung von São Paulo (FAPESP, Stipendien Nr. 2018/21934-5, 2018/04654-9 und 2023/02538-0).
Name | Company | Catalog Number | Comments |
Firefox | Mozilla Foundation (Open Source) | Any updated modern browser that is compatible with WebGL (https://caniuse.com/webgl), and in turn with Jmol, can be used | |
GNU Octave | Open Source | https://octave.org/ | |
Google Apps Script | Google LLC | script.google.com | |
Google Sheets | Google LLC | https://www.google.com/sheets/about/ | |
Laptop | Any computer that can run the eye tracking system software. | ||
Mangold Software Suite | Mangold | Software interface used for the Eye tracking device. Any Software that outputs the data with system time values can be used. | |
Mouse | Any mouse capable of clicking and dragging with simple movements should be compatible. Human interfaces analogous to a mouse with the same capabilities, such as a touchscreen or pointer, should be compatible, but may behave differently. | ||
Vt3mini | EyeTech Digital Systems | 60 Hz. Any working Eye Tracking device should be compatible. |
Genehmigung beantragen, um den Text oder die Abbildungen dieses JoVE-Artikels zu verwenden
Genehmigung beantragenThis article has been published
Video Coming Soon
Copyright © 2025 MyJoVE Corporation. Alle Rechte vorbehalten