加州大学伯克利分校的人工智能研究人员正在使用iPhone X和ARKit来训练机器人手臂分拣物品。这属于Dex Net AR项目的内容,并主要是研究如何通过消费者智能手机来实现机器人分拣物品。其中,通过利用将RGB摄像头围绕物品扫描两分钟而生成的数据,ARKit可以创建相应的点云。
机器人抓取是一个特殊的机器人学分支,并主要是研究如何教导机器人拾起、移动、操纵或抓取物体。加州大学伯克利分校自动实验室(UC Berkeley’s Autolab)的Dex Net(灵巧网络)研究项目可以追溯到2017年,并且包括开源培训数据集,以及在电商货物分拣场景中实现机器人操作的预训练模型。机器人快速学习如何抓取对象的能力将对亚马逊物流中心等自动化仓库的发展存在巨大影响。
在包含八个物体的早期实验中,Dex Net AR可以将ARKit扫描转换成ABB YuMi机器人的深度映射,并以95%的成功率分拣物体。作为说明,每次扫描都会创建一个点云。
名为《Dex-Net AR: Distributed Deep Grasp Planning Using an Augmented Reality Application and a Smartphone Camera》的论文介绍道:“随着摄像头在空间中移动,点云的密度增加,这可以更好地检测和定义对象的表面,从而方便机器人抓取物品。Dex-Net AR能够以类似于依靠昂贵工业级深度传感器的最先进系统的精度来实现物体抓取。与从固定视图(通常是自上而下)捕获图像的深度摄像头系统相比,Dex Net AR允许用户用智能手机摄像头围绕对象移动并收集三维点云数据。”
相关论文:Dex-Net AR: Distributed Deep Grasp Planning Using an Augmented Reality Application and a Smartphone Camera
Dex-Net-AR采用离群值消除算法和k近邻算法来消除ARKit点云估计误差所引起的噪点。然后,Dex-Net抓取规划器将评估机器人应如何拾取对象。
由于每一次ARKit扫描都需要固定的两分钟,所以研究人员在未来的研究中将寻找更快速扫描物体的方法。论文写道:“一个潜在的改进是,如果只有有限的数据,我们可以尝试使用基于学习的方法来减少视频捕获的时间,从而增加和完成点云数据”。研究人员同时计划探索如何更好地利用iPhone X深度传感摄像头来收集更少噪点的点云数据。