50 美元 + 一台旧手机 = 自主导航机器人? Intel:Yes!
打造一台能够执行人体跟踪, 自主导航等高阶任务的轮式机器人, 需要多少钱?
「应该挺多的吧,」估计大部分人都会给出这样的回答.
然而, 英特尔实验室最近开源的 OpenBot, 只需要 50 美元 (一顿火锅钱) 和一台从抽屉里翻出来的旧手机(四舍五入成本为 0).
OpenBot 的「大脑」是一台安卓智能手机,「机身」则是花费 50 美元打造的一款电动小车. 此外, 研究人员还开发了软件堆栈, 使智能手机可以对小车执行移动操作. 制作似乎很简单, 但 OpenBot 实际上能够支持高阶机器人任务, 如人体跟踪和实时自主导航.
OpenBot 系统设计图.
Openbot 由两部分组成: 一部智能手机和一个机器人外壳.
首先, 只要有一部智能手机, 就能满足三个方面的需求: 处理器 (CPU,GPU,AI 计算), 传感器(GPS, 摄像头等) 和通信接口(蓝牙, 4G/5G 网络).
与此同时, 机器人身体的制作成本也相当合理. 如果拆解开来, 你发现几乎都是常规的组装零件: 4 个 TT 马达车轮, 1 个 L298N 马达驱动板, 电池和电池座, 螺钉螺母, 弹簧 / 橡皮筋, 电线等, 或许你还需要 2 个橙色 LED 灯.
整个机身加在一起的成本, 不过 50 美元而已. 3D 打印模型文件也已经开源, 可以在 GitHub 上找到.
项目地址: https://github.com/intel-isl/OpenBot/tree/master/body
大概半小时到一小时, 即可完成组装:
接下来就可以上路试验了, 研究者分别测试了 Openbot 的人体跟踪和自主导航能力.
在测试了 10 种不同型号的智能手机之后, 结果显示, Openbot 始终能够稳定地完成人体跟踪任务.
在自主导航任务中, 它还学会了巧妙地躲避办公区走廊的盆栽植物.
接下来我们来看这项研究的核心内容.
为什么选择智能手机?
除了成本以外, 选择智能手机作为机器人的「大脑」还有很多优势. 定制机器人上的硬件组件会很快过时. 而消费级智能手机每年都会迭代, 分辨率和相机帧率都在不断提升, 处理器更快, 传感器和通信接口也更新.
如此一来, 那些售价低廉的二手机, 如果能作为机器人大脑, 也算是被赋予了第二次生命.
智能机的优势不止快速提升的硬件能力, 它们还具备蓬勃发展的软件生态系统. 这项研究利用移动物理机身和软件堆栈, 增强了这款机器人的感知和计算能力.
这项研究的主要贡献包括以下几点:
基于廉价可用的组件设计了一款小型电动车, 硬件成本仅为 50 美元, 这款电动车可作为轮式机器人的「机身」.
开发了软件堆栈, 允许智能手机将小车作为机身, 并实现实时感知和计算的移动导航.
该系统能够支持人体跟踪和自主导航等高阶机器人任务.
大量实验表明, 该方法不受智能手机型号和机身变化的影响.
那么, 这款轮式机器人的制造细节和效果到底如何呢? 我们来看详细介绍.
低成本轮式机器人是如何制造的?
机身
大脑没有身体则无法行动. 要想利用智能手机的算力和感知能力, 机器人还需要一个身体.
该研究基于可用的电子器件和 3D 打印零件为这个机器人开发了一个身体, 总成本 50 美元, 其中 40% 用在了电池上. 如果构建多个机器人, 则成本还会继续下降. 所有零件的详情和价格参见下表 1:
表 1: 材料价格表.
机身的构造包括机械设计和电路设计两部分. 下图展示了这款小车的机械设计:
下图展示了电路设计:
软件堆栈
如下图 4 所示, 该软件堆栈包含两部分: 安卓应用和 Arduino 程序.
安卓应用在智能手机上运行, 可以提供操作界面, 收集数据集, 运行高阶的感知和控制任务. Arduino 程序负责低阶的驱动和度量(如度量车轮里程, 监控电池电压等).
安卓应用和 Arduino 应用通过串行通信链路进行通信.
与其他轮式机器人有何区别?
该研究将这款轮式机器人与现有的机器人平台进行了对比, 参见下表 2. 与其他机器人相比, 该研究开发的平台拥有智能手机提供的大量处理能力, 通信接口和传感器.
现有的机器人通常依赖于定制的软件生态系统, 这需要专门的实验室人员来维护代码, 实现新功能. 而该研究使用了安卓系统 -- 最大且持续发展的软件生态系统之一. 无需机器人社区多做努力, 所有用于传感器集成和处理的低级软件已经存在且不断改进. 所有传感器已经实现时钟同步, 从而消除了很多现有机器人面临的主要挑战.
实验
Openbot 迎来的第一项考验是人体跟踪(Person Following), 第二项考验是自主导航(Autonomous Navigation).
人体跟踪任务
该实验研究了在智能手机上运行复杂的 AI 模型的可行性. 研究人员使用目标检测器并应用视觉伺服来跟踪人. 实验表明, 所有最新的中端智能手机均能以 10 fps 或更高的速度持续跟踪人.
自主导航任务
研究人员训练了一个在大多数智能手机上都能实时运行的驾驶策略. 学到的策略能够沿着走廊前进, 并在交叉路口转弯. 研究人员将其与现有的驾驶策略进行比较, 并获得与基线相似的性能, 而所需参数减少了大约一个数量级.
驾驶策略的训练流程.
除此以外, 该研究还成功地将驾驶策略迁移到了不同的智能手机和机身上. 实验表明, 该研究的驾驶策略能够泛化至之前没见过的环境, 新对象, 甚至动态障碍物(如人), 即使是在训练数据中仅存在静态障碍物的情况下.
下表展示了该研究驾驶策略在新手机上的泛化效果:
下表展示了该研究提出的驾驶策略在不同机身上的泛化效果:
论文地址: https://arxiv.org/abs/2008.10631
来源: https://www.jiqizhixin.com/articles/2020-08-27-9