查看引用 / 信息源请点击: 映维网
利用手机摄像头的手部追踪来控制蓝牙假手
(映维网 2021 年 06 月 01 日)Mirru 是一个正在开发中的开源 Android 应用, 其可通过手部追踪技术来帮助用户控制机器假手. 利用这个免费的工具, 你可以立即将各种手部动作映射到机器人假手(可以以低成本进行 3D 打印和组装). 团队表示:"我们希望提供一种廉价, 直观, 开放的端到端解决方案来替代当前昂贵且繁琐的专有技术."
图 1:Mirru App 使用 MediaPipes 手部追踪来移动机械手指的演示.
Mirru 团队由位于巴黎的独立设计师与技术专家维奥莱塔. 洛佩兹 (Violeta López) 和弗拉基米尔. 赫尔曼德 (Vladimir Hermand) 组成. 为了启动这个项目, 团队参加了 Tweag 的 Open Source Fellowship 项目, 从而获得相关的资金, 指导和数据工程专业知识.
相关的 Fellowship 项目为期三个月, 而团队的目标是开发一个利用计算机视觉技术来控制蓝牙假手的初始版 Android 应用, 然后在 Google Play 商店免费提供. 在 MediaPipe 的帮助下, 团队快速地原型化所述应用程序, 因为其不必构建自己的机器学习模型(没有资源或训练数据).
1. 为什么使用手部追踪?
利用能够用于手部追踪的前置摄像头和智能手机, 这可以带来一种全新的, 经济实惠的的多功用假肢控制方式.
假设我是一名左手截肢者, 并拥有一个机器假肢. 我每天都需要假肢来执行不同的夹点操作. 例如, 我需要假肢摆出捏指姿态来拾取小物品, 或者摆出半握拳状来拾取水果或杯子之类的物品. 我可以通过肌电肌肉传感器来改变和执行相应的夹点模式, 例如, 通过弯曲和放松上肢肌肉来打开和关闭操作模式. 这种肌电肌肉传感器是身体和假体之间的主要接口.
然而, 这并不像看上去那么容易. 控制肌电传感器需要耗费大量的时间以习惯和掌握, 而且很多人从来没有这样做过. 医生为你安装传感器同样价格不菲, 尤其是对于发展中国家或没有医疗保险的人士. 最后, 目前大多数设备的夹点数量限制在 10 个以下, 只有少数型号提供了创建自定义夹点的方法, 但通常非常麻烦.
Mirru 提供了一个替代接口. 只需使用几乎人人都拥有的智能手机, 你就可以实时将手部动作映射到假肢, 并以直观的方式与其通信. 这同时允许用户能够快速编程无限量的假手夹点. 目前, Mirru 不涉及肌电图, 因为可靠的肌肉传感器价格昂贵. 编程的夹点需要通过 Android 手机触发. 所以, 这个应用程序的第一版更适合诸如扫地, 看书, 或者拿杯子或购物袋这样的活动. 在未来, 团队希望将肌电传感器与手部追踪相结合.
用 Mirru 应用程序编程一个夹点如下面的 GIF 动图所示: 假设我想用机械假手抓住一个物品, 我需要将假肢放到所述物品前面, 然后另一只真手在 Android 手机前面摆出相应的动作. 这时, Mirru 会将这个动作实时映射到假肢. 然后, 我可以锁定假肢锁, 并解放我的真手. 最后, 我可以保存这个夹点供日后使用, 并将其添加到我的夹点库中.
图 2: 被试使用智能手机的手部追踪来编程的假肢夹点, 以拿起卷尺并用另一只手测量.
2. Brunel Hand 和 Mirru Arduino Sketch
为了实现帮助尽可能多的人能够打印, 组装和控制自己的假肢, 团队设计了 Mirru 这个 Android 应用, 并用于操作通过支持蓝牙型 Arduino 板和伺服电机进行控制的机器假手.
在项目中, 团队 3D 打印并组装了一个由 Open Bionics 制造的开源机械手 Brunel. 首先, 团队 3D 打印了 CC Attribution-Sharealike 4.0 International License 许可下的 3D 打印文档, 然后购买了必要的伺服系统, 弹簧和螺丝来装配假手. 这只假肢的成本大约为 500 欧元(约合人民币 3892 元).
Brunel Hand 配备了基于肌电的固件和由 Open Bionics 开发的 PCB 板, 但由于它只有 4 个伺服电机, 你可以使用任何微控制器. 团队最终使用 Adafruit ESP32 来实现蓝牙功能, 并创建了一个 Arduino Sketch 供用户自行下载, 定制和上传. 然后, 你可以下载 Mirru 应用程序, 并将其用作 3D 打印假手的控制界面.
3. 用 MediaPipe 进行手部追踪
业内有一系列的手部追踪计算机视觉解决方案可用于这个项目, 但团队需要一个快速的, 开源的解决方案, 不需要自行训练模型, 并能够可靠地用于便携式设备, 如智能手机.
MediaPipe 为手部追踪提供了出色的开箱即用支持, 由于团队没有可用的训练数据或资源从零开始创建模型, 所以它非常适合这个项目. 团队能够轻松地构建 Android 示例应用. 更好的是, 团队不需要对现成的手部追踪模型进行任何调整, 因为 hand landmark 模型为原型提供了所有必要的输出.
当对真实用户测试假肢时, 许多人都对这款应用能够以如此快速地映射手部动作感到印象深刻.
图 3: 一名用户正在演示 MediaPipe 手部系统能以多快的速度将真实手指动作转化为假肢手指的动作.
4. 将 3D MediaPipe 转化成机器假手的输入
为了实现 Mirru 应用程序的目标, 团队需要使用手部追踪来实时地, 独立地控制 Brunel Hand 的每个手指. 对于这个假肢, 食指, 中指和无名指通过伺服装置驱动, 而后者以 0 到 180 度的角度移动; 0 表示手指完全竖直, 180 表示手指完全向下弯曲. 由于缺乏足够的训练数据, 团队无法从零开始创建一个模型来为计算所述地伺服角度, 所以洛佩兹和赫尔曼德选择使用一种启发式方法, 将默认的 landmark 输出与原型所需的硬件输入相关联.
图 4: 在实验室用所述 App 和原型测试输出到输入的转换.
团队一开始不确定 3D landmark 中的估计深度 (Z) 坐标是否足够精确并用以转换输入, 或者它是否仅限于 2D. 作为第一步, 团队记录了一个示例数据集, 并在 Jupyter Notebook 用 Plotly 实现了点的可视化. 考虑到这项技术只使用一个摄像头, 没有任何深度传感器, 坐标的质量和精度立刻给团队留下了深刻的印象. 正如 MediaPipe 文档中提到地一样, Z 坐标与 X/Y 坐标的比例略有不同, 但这似乎并没有对原型构成重大挑战.
图 5: 由 21 个 3D 手部 landmark 组成的手部数据可视化.
考虑到 3D landmark 的准确性, 团队选择 3D 计算以将 landmark 输出与假肢所需的输入相关联. 在相关的方法中, 团队计算手指方向和手掌定义的平面法线之间的角度, 从而计算手指相对于手掌的锐角. 角度为 0 度对应于手指的最大闭合度, 角度为 180 度表示手指完全伸出. 可以通过计算从手指底部的 landmark 到指尖的 landmark 的向量来计算手指的方向.
图 6:3D landmark 的图表, 以及用来计算手指方向向量, 手掌法线和两者形成角度的 landmark.
团队通过选择手掌平面的三个点来计算手掌法线. 使用 Landmark 0 作为参考点, 团队计算边 1 和边 2 的向量, 并计算向量的叉积以得到手掌法线. 最后计算手指方向与手掌法线的夹角. 它以弧度为单位返回用于计算度数的角度.
团队必须进行额外的处理来匹配假手拇指的自由度. 拇指的运动方式比其他手指更复杂. 为了允许应用程序使用拇指, 团队对拇指方向和手掌法线进行了类似的计算, 但使用了不同的 landmark.
一旦在 Android 手机计算了伺服角度, 团队就可以通过蓝牙将相关值发送到 Arduino 板, Arduino 板将伺服移动到正确的位置. 由于模型输出中存在一定的噪点, 团队在管道中添加了一个平滑步骤. 这一步骤非常重要, 因为机器手指的运动就不会过于抖动而无法精确抓握.
图 7: 一名被试正在通过 Mirru App 令假肢执行捏指动作.
5. 总结
Mirru 应用程序和 Mirru Arduino Sketch 的设计是为了帮助任何人用自己的真手和 Android 手机来控制一个开源的假肢. 这是一个新颖和低成本的肌肉传感方案替代品. 另外, MediaPipe 已经证明它是实现手部追踪组件的正确工具. Mirru 团队能够快速开始使用 MediaPipe 的现成解决方案, 无需收集任何训练数据或从零开始设计模型. 从追踪点到机械手的实时转换速度特别快, 这让 Mirru 的用户感到非常兴奋, 并为假肢的未来开辟了众多可能性.
至于 Mirru 应用程序的当前状态, 团队尚未实现记录和保存序列长于静态夹点位置的移动手势. 例如, 记录手指弹奏钢琴的连串动作. 但团队表示, 假肢的未来存在众多等待挖掘的可能性.
对于将 MediaPipe 手部追踪功能与现有肌电假肢相结合的潜力, 团队感到非常兴奋, 因为这将为实时创建和保存定制假肢夹点提供强大而先进的方法. 另外, 在 MediaPipe 的帮助下, 团队能够提供一种开源的专有假肢替代方法, 无需使用肌电传感器, 无需拜访假肢医生, 而且成本要比市场中的已有方案要低得多, 同时源代码可以由其他开发者定制和构建. 团队非常期待开源社区的其他想法, 以及手部追踪技术能给假肢用户和制造商带来什么.
如果有任何想法或评价, 你可以通过这个邮件联系 Mirru 团队. 另外, 你可以访问相关的 GitHub 页面.
来源: https://new.qq.com/omn/20210601/20210601A02DH400.html