В статье представлен комплексный протокол одновременной записи электромиографии руки (ЭМГ) и визуального отслеживания пальцев при естественной жестикуляции пальцев. Визуальные данные призваны служить основой для разработки точных вычислительных моделей на основе ЭМГ для распознавания жестов пальцев.
Жесты пальцами являются важнейшим элементом человеческого общения, и поэтому распознавание жестов пальцами широко изучается как человеко-компьютерный интерфейс для современного протезирования и оптимизированной реабилитации. Поверхностная электромиография (ЭМГ) в сочетании с методами глубокого обучения считается перспективным методом в этой области. Тем не менее, современные методы часто полагаются на громоздкие настройки записи и идентификацию статичных положений рук, что ограничивает их эффективность в реальных приложениях. Протокол, о котором мы сообщаем здесь, представляет собой передовой подход, сочетающий в себе ЭМГ носимой поверхности и систему отслеживания пальцев для сбора исчерпывающих данных во время динамических движений рук. Метод регистрирует мышечную активность с мягких печатных электродных решеток (16 электродов), размещенных на предплечье, когда испытуемые выполняют жесты в различных положениях рук и во время движения. Визуальные инструкции побуждают испытуемых выполнять определенные жесты, во время записи ЭМГ и положения пальцев. Интеграция синхронизированных записей ЭМГ и данных отслеживания пальцев позволяет всесторонне анализировать паттерны мышечной активности и соответствующие жесты. Представленный подход демонстрирует потенциал объединения технологий ЭМГ и визуального отслеживания в качестве важного ресурса для разработки интуитивно понятных и отзывчивых систем распознавания жестов с приложениями в протезировании, реабилитации и интерактивных технологиях. Этот протокол призван служить руководством для исследователей и практиков, способствуя дальнейшим инновациям и применению распознавания жестов в динамических и реальных сценариях.
Жестикуляция рук имеет важное значение в человеческом общении, что делает распознавание жестов пальцев важнейшей областью исследований в таких областях, как взаимодействие человека и компьютера, передовое протезирование 1,2,3,4 и реабилитационные технологии 5,6. В результате, распознавание жестов пальцами привлекло значительное внимание благодаря своему потенциалу для улучшения интуитивно понятных систем управления и вспомогательных устройств. Поверхностная электромиография (ЭМГ) в сочетании с алгоритмами глубокого обучения становится весьма перспективным подходом к захвату и интерпретации этих жестов благодаря своей способности обнаруживать электрическую активность мышц, связанную с движениями рук 7,8,9,10,11,12,13,14,15.
Однако, несмотря на эти достижения, современные подходы сталкиваются с ограничениями в реальных приложениях. Большинство существующих систем требуют сложных, громоздких записывающих установок с многочисленными электродами 5,7,9,16,17 и точным позиционированием 3,18, которые часто трудно реализовать вне контролируемых сред. Кроме того, эти системы имеют тенденцию фокусироваться на статичных положениях рук 13,18,19,20,21, ограничивая их способность интерпретировать динамичные, плавные жесты, которые происходят в повседневной деятельности. Протокол направлен на устранение этих ограничений путем поддержки динамического распознавания жестов в более естественных условиях. Такая методология обеспечит более практичное и удобное применение в таких областях, как протезирование и реабилитация, где перевод естественных жестов в режиме реального времени имеет важное значение.
Для решения этих проблем для разработки более точных и адаптируемых алгоритмов требуются наборы данных, отражающие естественные, повседневные условия 3,4. Такие наборы данных должны охватывать широкий спектр динамических движений, различных положений рук и больших объемов данных для обеспечения надежности модели. Кроме того, решающее значение имеет вариативность между обучающими и тестовыми наборами данных, что позволяет моделям обобщать различные положения рук, паттерны активации мышц и движения. Включение такого разнообразия в данные позволит алгоритмам более точно выполнять распознавание жестов в повседневных реальных приложениях22.
Преодоление этих проблем будет иметь важное значение для будущего развития более практичных и широко применимых систем распознавания жестов. Исследование и протокол, описанные здесь, проистекают из необходимости иметь портативную, удобную для пользователя установку, которая может фиксировать динамические движения рук в естественных условиях. Всеобъемлющие наборы данных и передовые алгоритмы имеют решающее значение для полного раскрытия потенциала sEMG и глубокого обучения в человеко-машинных интерфейсах, нейропротезировании и реабилитационных технологиях. Мы ожидаем, что этот протокол внесет свой вклад в эту область, облегчив всесторонний сбор данных, чтобы в дальнейшем обеспечить разработку моделей алгоритмов, которые обобщают различные позиции рук.
Серьезная проблема в распознавании жестов заключается в чувствительности сигналов sEMG к позиционированию руки. В то время как многие исследования сосредоточены на фиксированных положениях рук для прогнозирования жестов, для реальных приложений требуются модели, способные распознавать движения пальцев в различных положениях рук. Последние подходы решают эту проблему путем включения компьютерного зрения в качестве эталона достоверной информации, повышая точность и гибкость этих моделей15,19. Кроме того, гибридные модели, которые интегрируют сигналы sEMG с визуальными данными, обеспечивают дальнейшее повышение точности распознавания в различных сценариях23.
В этом протоколе мы представляем синхронизированный подход к сбору данных, который улучшает динамическое распознавание жестов за счет включения данных ЭМГ и отслеживания рук в реальных условиях. В отличие от традиционных методов, которые ограничивают выполнение жестов статичными положениями, этот протокол включает жесты, выполняемые в четырех различных положениях: рука вниз, рука вверх, прямая рука и движение руки. Камера слежения за руками отслеживает движения рук в трехмерной интерактивной зоне, идентифицируя отдельные элементы рук и фиксируя динамические движения с высоким разрешением. Массив мягких электродов из 16 электродов, размещенный на предплечье для записи мышечной активности, обеспечивает стабильную и беспроводную запись, не препятствуя подвижности участников. Синхронизированные данные из этих двух источников обеспечивают всестороннюю основу для разработки передовых алгоритмов распознавания жестов, способных работать в реальных условиях. Этот подход специально устраняет ограничения существующих установок, обеспечивая свободное перемещение и стабильную запись сигнала в реалистичных сценариях. Это достижение поддерживает технологии распознавания жестов для применения в протезировании, реабилитации и интерактивных технологиях, где интуитивно понятное управление и гибкость имеют важное значение.
Здоровые участники (n = 18, в возрасте 18-32 лет, как мужчины, так и женщины) были отобраны для этого исследования, которое было одобрено Советом по этике Тель-Авивского университета (одобрение No 0004877-3). Протокол соответствует руководящим принципам комиссии в отношении исследований с участием людей. Информированное согласие было получено от всех участников в соответствии с институциональными требованиями.
1. Инструктаж экспериментатора
Рисунок 1: Схематическое изображение процесса сбора данных. Испытуемый оснащен матрицей мягких электродов, размещенной на предплечье (3), которая улавливает сигналы поверхностной электромиографии (ЭМГ) высокого разрешения во время выполнения жестов. Испытуемый выполняет 14 различных жестов пальцами, представленных в случайном порядке на дисплее компьютера (4). Данные ЭМГ передаются по беспроводной сети на персональный компьютер (ПК) с блока сбора данных (DAU; 1). Одновременно кинематические данные кисти руки (HKD), представляющие углы суставов пальцев, захватываются с помощью камеры слежения за руками (2). Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этой цифры.
2. Настройка блоков сбора данных
3. Подготовка участников
4. Сбор данных
5. Окончание эксперимента и обработка данных после него
Набор данных состоит из двух синхронизированных по времени компонентов: 16-канального набора данных ЭМГ и данных с камеры ручного слежения. 16-канальные данные ЭМГ фиксируют мышечную активность, записывая электрические сигналы от различных мышц с течением времени. Система отслеживания рук обеспечивает 16 каналов данных, соответствующих ключевым точкам на скелетной модели руки. В то время как модель имеет 21 очко, исключая запястье, это число было уменьшено до 16 из-за ограничений движения24. ЭМГ и визуальные данные были собраны путем запуска двух отдельных процессов на одном компьютере во время записи для установления синхронности. Временная метка использовалась для обозначения начала каждого процесса, что позволяло коду анализа данных согласовывать мышечную активность и данные о движениях рук в конце записи. Аннотации к меткам времени автоматически сохранялись в файлах EDF и CSV, отмечая точное время, когда были даны инструкции по конкретным жестам пальцев, и облегчая выравнивание во время анализа данных. Отфильтрованный сигнал ЭМГ (фильтр высоких частот Баттерворта 4-го порядка с частотой 20 Гц) характеризуется низкой базовой линией (серыми затененными областями), которая обычно находится в диапазоне 3-9 мкВ25. Этот исходный уровень наблюдается, когда рука испытуемого неподвижна, а мышцы находятся в состоянии покоя. Однако, если мышечный тонус присутствует даже в положении покоя, можно обнаружить отчетливый сигнал ЭМГ. Механические артефакты, вызванные движением, обычно проявляются в диапазоне 10-20 Гц и должны быть отфильтрованы соответствующим образом. Значительно завышенные базовые значения могут указывать на помехи в линии с частотой 50 Гц, и их следует избегать на этапе экспериментальной настройки. В случаях, когда сохраняется умеренный шум 50 Гц; Применяется режекторный фильтр. Резкие артефакты движения, которые труднее удалить, часто проявляются в виде выраженных высокоамплитудных всплесков сигнала (см. звездочку на рисунке 2A). Амплитуда сигнала ЭМГ на 16-электродной решетке варьируется, отражая пространственное распределение мышечной активности по измеряемой области. Эта вариативность дает ценную информацию о гетерогенности сокращения мышц во время жестов рук.
Камера слежения за руками предоставляет прямую информацию об углах наклона пальцев (кинематические данные руки, HKD), которые, как ожидается, будут тесно коррелировать с записанными сигналами ЭМГ. Во время жестов углы пальцев в пределах нормы26, в зависимости от конкретного жеста. Когда визуальный путь между камерой слежения за рукой и рукой не затруднен, результирующий сигнал является стабильным и точным, как показано на рисунке 2. Однако в случаях потери визуального контакта или когда система испытывает технические ограничения, HKD может стать неустойчивым, отображая скачки между неправильными значениями. Такие выбросы данных должны быть сведены к минимуму во время сбора данных и отброшены в окончательном анализе, чтобы сохранить целостность результатов.
HKD интуитивно понятен и обеспечивает прямое сравнение с реальными выполняемыми жестами. Он демонстрирует низкую вариабельность между объектами и в разных положениях рук. В отличие от этого, данные ЭМГ имеют тенденцию значительно различаться у разных людей из-за анатомических различий, таких как размер кистии развитие мышц. Кроме того, может наблюдаться вариативность между доминирующими и недоминирующими руками. Эта предметная вариативность может быть рассмотрена в ходе автономного анализа.
На рисунке 2 видно, что и ЭМГ, и HKD смещены относительно заданного триггера жеста. Это расхождение возникает из-за времени отклика и естественного выполнения движения28. В задачах регрессии такая изменчивость может способствовать обогащению данных, в то время как в задачах классификации ею можно управлять с помощью метода обобщенного отношения правдоподобия, который применяется в аналогичных сценариях28.
Рисунок 2: Репрезентативные sEMG и HKD во время отведения пальца. Сигналы поверхностной электромиографии (ЭМГ) и кинематические данные кисти руки (HKD), записанные во время динамического отведения и покоя пальцев, выполняемого в положении руки 1 (рука опущена, прямая и расслаблена) одним участником. (A) Отфильтрованные ЭМГ-сигналы из 16 каналов в зависимости от времени. Звездочка (*) обозначает механический артефакт, обнаруженный в записи ЭМГ 5-го канала. (B) HKD, показывающий углы соединения в зависимости от времени. Углы суставов измеряются в различных суставах: трапециевидно-пястном (ТМК), пястно-фаланговом (МКП) и проксимальном межфаланговом (ПИП). Фазы эксперимента (отдых и отведение) обозначены по оси x. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этой цифры.
Эти репрезентативные результаты продемонстрировали полезность синхронизированных данных ЭМГ и HKD для захвата жестов рук. Согласование сигналов ЭМГ с соответствующими HKD позволяет сопоставлять мышечную активность с конкретными движениями пальцев. При построении прогностической модели исследователи могут использовать HKD в качестве исходной истины, итеративно проверяя и уточняя предсказания жестов на основе ЭМГ. Такой подход подчеркивает практическую применимость протокола и предполагает необходимость дальнейших исследований в более естественных условиях.
Дополнительный рисунок 1: Окна спектрограммы, отображаемые на этапе проверки сигнала. На левой панели отображаются необработанные данные ЭМГ, а на правой — обнаруженные частотные области. (A) Пример очень зашумленного электромагнитного сигнала с сильными помехами 50 Гц и 100 Гц. (B) Пример записи того же ЭМГ-сигнала после удаления участника от электрических устройств, в результате чего получается чистый ЭМГ-сигнал с минимальными помехами. Пожалуйста, нажмите здесь, чтобы загрузить этот файл.
Протокол, представленный в этом исследовании, описывает критические шаги, модификации и стратегии устранения неполадок, направленные на улучшение распознавания жестов рук за счет комбинации сигналов sEMG и HKD. В статье рассматриваются ключевые ограничения и сравнивается этот подход с существующими альтернативами, а также выделяются его потенциальные применения в различных областях исследований. Одним из наиболее важных аспектов протокола является обеспечение правильного позиционирования и выравнивания камеры слежения за руками. Точный захват жестов в значительной степени зависит от угла наклона и расстояния от камеры относительно руки участника. Даже незначительные отклонения в позиционировании камеры могут привести к неточностям отслеживания, снижая точность данных жестов. Это выравнивание должно быть тщательно отрегулировано для каждого участника и положения руки, чтобы обеспечить последовательный и надежный сбор данных. Кроме того, крайне важно, чтобы участники были хорошо знакомы с протоколом, чтобы предотвратить утечку ненужных данных, когда жесты либо выполняются неправильно, либо не согласуются с экспериментальным потоком. Обеспечение того, чтобы участники чувствовали себя комфортно и знакомы с жестами и экспериментальной установкой, может свести к минимуму шум данных и улучшить качество записей.
Общей проблемой в этом типе исследований является шумовое загрязнение как в sEMG, так и в HKD. Сигналы sEMG особенно чувствительны к таким факторам, как мышечная усталость, артефакты движения и шум окружающей среды, такой как электромагнитные помехи. Методы предварительной обработки, такие как полосовая фильтрация, необходимы для снижения шума и повышения четкости сигнала. Правильное размещение электродов и инструктаж участников по поддержанию расслабленных мышц во время фаз отдыха могут еще больше смягчить двигательные артефакты. Несмотря на эти меры предосторожности, некоторая вариабельность сигналов сЭМГ неизбежна из-за индивидуальных различий в анатомии, силе рук и паттернах мышечной активации. Эта изменчивость может быть устранена с помощью гибких алгоритмов, способных нормализовать эти различия между субъектами и условиями.
Ключевым фактором для получения высококачественных сигналов sEMG является первоначальная проверка сигнала. Традиционные протоколы с использованием гелевых электродов требуют подготовки кожи, такой как отшелушивание или очищение спиртом, для улучшения четкости сигнала. Тем не менее, в предыдущем исследовании мы показали, что при использовании сухих электродов подготовка кожи может не оказывать существенного влияния на качество сигнала. В этом протоколе чистка кожи не является обязательной и, таким образом, упрощает процесс. Еще одной проблемой, связанной с кожей, влияющей на качество сигнала, является чрезмерная и густая шерсть на руках. В таких случаях мы предлагаем либо сбрить область, либо исключить объект из исследования.
Одной из важнейших проблем при использовании sEMG для распознавания жестов является его чувствительность к положению руки. Даже при выполнении одного и того же жеста различия в ориентации рук могут привести к различным паттернам сигнала ЭМГ. Для решения этой проблемы необходимы модели машинного обучения, которые могут учитывать вариативность положения рук22. Эти модели должны быть обучены на данных из нескольких положений рук для повышения надежности и обобщаемости. Синхронизация визуальных данных и данных sEMG является еще одним важным фактором. Согласованное время жестов имеет решающее значение для предотвращения расхождений между выполнением жестов и записью данных. Этот протокол использует визуальный обратный отсчет и звуковые сигналы, чтобы обеспечить точное время и повторную калибровку, когда это необходимо для исправления любого смещения во время сбора данных.
Несмотря на свои сильные стороны, этот протокол имеет несколько ограничений. Одним из основных ограничений является ограниченное поле зрения камеры слежения за руками, которое требует, чтобы руки участника оставались в пределах дальности обнаружения камеры. Это ограничивает анализ небольшим набором движений. Для экспериментов вне лаборатории потребуется более сложная видеосъемка или использование умных перчаток. Усталость участников также представляет собой проблему во время длительных сеансов, потенциально влияя на точность жестов и активацию мышц, что может ухудшить качество данных sEMG. Чтобы смягчить эти эффекты, может потребоваться ограничить продолжительность сеанса или ввести перерывы, чтобы свести к минимуму усталость. Кроме того, помехи от линии электропередачи могут вносить шум в сигналы sEMG, особенно когда участники находятся близко к ПК для сбора данных. Беспроводная версия системы может уменьшить такие помехи, позволяя участникам находиться дальше от компьютера.
Существенным методологическим ограничением детекции пальцевых жестов на основе ЭМГ является высокая межсубъектная вариабельность сигналов сЭМГ, что требует разработки пользовательских моделей для каждого участника. Такой подход, ориентированный на конкретную тему, хотя и более точный, ограничивает масштабируемость протокола и требует дополнительного времени на калибровку и обучение для каждого нового пользователя. Потоки данных EMG и HKD демонстрируют незначительные различия во временной синхронизации из-за двойной записи процесса. Эти временные расхождения оказывают минимальное влияние на статический анализ жестов, поскольку поддерживаемые позы являются временно стабильными. Устойчивый характер статических жестов обеспечивает достаточное время для стабилизации как ЭМГ, так и кинематических функций, в отличие от динамических жестов, которые требуют более точной синхронизации.
Ключевым преимуществом этого метода является его гибкость в захвате жестов. В отличие от других систем, требующих жестких настроек и строгих параметров жестов, этот протокол обеспечивает динамическое и гибкое положение рук19. Эта гибкость особенно полезна в исследованиях, направленных на анализ широкого диапазона движений, что делает его более адаптируемым к реальным приложениям. Кроме того, этот протокол является экономически эффективным по сравнению с более совершенными системами захвата движения и sEMG, которые часто включают в себя сложные настройки. Благодаря интеграции камеры слежения за руками с полуавтоматическими алгоритмами sEMG, этот метод представляет собой жизнеспособную альтернативу для исследований распознавания жестов без ущерба для качества данных. Кроме того, потенциал системы для обработки данных в режиме реального времени открывает возможности для немедленной обратной связи в таких приложениях, как нейропротезирование и реабилитация, где важна реакция в режиме реального времени. Этот протокол имеет значительные последствия для нескольких областей, в частности для нейропротезирования. Точное прогнозирование жестов рук по сигналам sEMG имеет решающее значение для управления протезами конечностей, а гибкость в позиционировании рук, обеспечиваемая этим методом, делает его идеальным кандидатом для протезирования в режиме реального времени. В реабилитации этот протокол может быть использован для мониторинга и улучшения моторного восстановления у пациентов с нарушениями кисти или пальцев. Анализируя паттерны активации мышц во время выполнения жестов, эта система может быть использована для адаптации реабилитационных упражнений к индивидуальным потребностям, предлагая персонализированный подход к восстановлению моторики. Для взаимодействия человека и компьютера (HCI) этот метод позволяет создавать более естественные системы управления, основанные на жестах, повышая интуитивность и эффективность пользовательских интерфейсов. Наконец, протокол может быть применен к эргономическим исследованиям, чтобы оценить, как различные положения рук и жесты влияют на мышечную активность и усталость, что потенциально может привести к прогрессу в дизайне рабочего места и эргономике пользователя.
Чтобы обеспечить постоянную силу сжатия у всех участников, в будущих исследованиях можно было бы использовать перчатки с чувствительными к силе резисторами для непосредственного измерения силы. Это позволит стандартизировать работу по всем предметам, повысив надежность данных ЭМГ. Кроме того, интеграция этого измерения силы в качестве метки в кинематику суставов обеспечит более подробное представление о внутреннем состоянии мышцы, потенциально обогащая анализ мышечной функции и моделей движения. Такой подход не только повысит согласованность данных, но и обеспечит более глубокое понимание взаимосвязи между сокращением мышц и движением суставов.
В заключение следует отметить, что этот протокол обеспечивает новый и гибкий подход к распознаванию жестов рук с широким применением в нейропротезировании, реабилитации, гиперконвергентной инфраструктуре и эргономике. Несмотря на то, что система имеет ограничения, ее гибкость, экономичность и потенциал для использования в режиме реального времени представляют собой существенный шаг вперед по сравнению с существующими методами. Эти сильные стороны делают его многообещающим инструментом для дальнейшего развития и инноваций в технологиях распознавания жестов.
Яэль Ханейн заявляет о финансовой заинтересованности в компании X-trodes Ltd, которая коммерциализировала технологию трафаретной печати электродов, используемую в этой статье. Другие авторы не имеют никаких других существенных финансовых связей с какой-либо организацией или учреждением, имеющим финансовую заинтересованность или финансовый конфликт с предметом или материалами, обсуждаемыми в рукописи, кроме раскрытых.
Этот проект был частично профинансирован за счет гранта от ERC (OuterRetina) и ISF. Спонсоры не играли никакой роли в дизайне исследования, сборе и анализе данных, принятии решения о публикации или подготовке рукописи. Мы благодарим Дэвида Бузагло, Чени Хермона, Лирона Бен Ари и Ади Бен Ари за их помощь в разработке оригинальной версии протокола.
Name | Company | Catalog Number | Comments |
Adjustable Selfie Stick | Used to position and angle the hand-tracking camera in the desired orientation for optimal data capture during the experiment. | ||
Alcohol pad | To clean the area for electrode placement. | ||
Data acquisition unit (DAU) | X-trodes Ltd. | XTR-BT V1.3 | Realtime compatible DAU 2.0.17 or 4.0.1 |
Finger Gestures Recognition library | https://github.com/NeuroEngLabTAU/Fingers_Gestures_Recognition.git | ||
Leap Motion Controller 2 | Ultraleap | 129-SP4-00005-03 | Hand-tracking camera |
Long Type-C to Type-C cable | Connection of the hand-tracking camera to the PC. | ||
PC Monitors | One for guidelines, one for viewing the hand-tracking camera data | ||
Personal Computer (PC) | Windows | Windows 10+; Processors: Inteli7 processor. BT receiver. | |
Python code | A script enabling seamless data streaming and recording up to 500 S/s when DAU is connected to PC via Bluetooth | ||
Ultraleap Camera Python API | Ultraleap | Python API and instructions from Ultraleap’s GitHub repository (https://github.com/ultraleap/leapc-python-bindings) used to collect data from the Ultraleap unit during the experiment | |
Ultraleap Hyperion | Ultraleap | Tracking software | |
XTR EXG16 | X-trodes Ltd. | XTELC0003405RM | 16-channel wearable dry electrode array patch for EMG, ECG monitoring |
X-trodes PC App | X-trodes Ltd. | 1.1.35.0 | An application for connecting X-trodes DAU to PC via BT |
Запросить разрешение на использование текста или рисунков этого JoVE статьи
Запросить разрешениеThis article has been published
Video Coming Soon
Авторские права © 2025 MyJoVE Corporation. Все права защищены