布朗大学和麻省理工学院的研究人员已经开发出一种方法,可以帮助机器人通过构建周围世界的抽象画像,来帮助机器人完成连续的多个步骤的任务。研究发表在《人工智能研究》杂志上,这意味着朝着构建能思考和行动更像人的机器人又迈出了一步。
对于机器人来说,由于他们对世界的感知和互动有限,计划变成了一件非常困难的事情。机器人对世界的感知仅仅是由它的摄像头收集的大量像素组成的,它的行动能力仅限于设置控制其关节和钳子的单个马达的位置,先天缺乏理解能力,不明白这些像素与我们可能认为的世界上有意义的概念有多大关联。
布朗大学计算机科学助理教授,这项新研究的主要作者 George Konidaris 说,只与世界进行低层次的接触使得很难决定该做什么。想象下如果你要去杂货店,但是需要考虑每块肌肉怎么动才能到达,还要提前想象一路上会通过视网膜的详细的视觉数据,这会有多难计划,你会立即陷入细节的泥潭。当然人类不会这样做,我们能够引入一些抽象概念,把大量不相干的细节抛诸脑后,只专注于重要的事情。
即使是最先进的机器人也无法实现这种抽象。当我们看到机器人计划和执行多步骤任务时,几乎总是有这样的情况,程序员明确告诉机器人如何思考这个世界,以便制定一个计划,但如果我们想要机器人能更自主地行动,它们就需要能够自主学习抽象概念。
在计算机科学术语中,这类抽象分为两类:程序抽象和感性抽象。程序抽象是由低层次的动作组成的程序,这些动作组成了更高层次的技能。一个例子就是把所有需要打开的小动作捆绑在一起,所有的动作都涉及到把手,转动它,把门开成为一个打开门的技能。一旦这样的技能建立起来,你就不用担心它是如何工作的了,只需要知道什么时候运行它,包括 Konidaris 自己在内的机器人专家们一直在研究如何让机器人学习程序抽象。
但根据 Konidaris 的说法,在感知抽象方面的进展比较少,与帮助机器人理解其像素化的环境有关,这正是这项新研究的重点。他们的研究表明,一旦机器人拥有高水平的运动技能,它就能自动构建出一种能与世界相适应的高水平符号表示,这是一种非常适合于使用这些技能的计划。
学习抽象世界
在这项研究中,研究人员介绍了一个名为 Anathema(简称 Ana)的机器人,它的房间里有一个橱柜,一个冰箱,一个控制橱柜内部光线的开关,以及一个可以放在冰箱或橱柜里的瓶子。他们给了 Ana 一套高级的动作技能,用来操控房间里的物品,打开和关闭冰箱和橱柜,翻转开关,拿起一个瓶子。然后让 Ana 放松,在房间里尝试他的运动技能,在每个技能执行之前和之后记录她的相机和执行器的感觉数据。这些数据被输入到由团队开发的
机器学习算法中。
研究人员表示,Ana 能够学习到一种非常抽象的环境描述,这种描述只包含了他能够胜任某项特定技能所必需的。例如他了解到为了打开冰箱,站在它的前面的时候不拿任何东西,因为他需要用双手打开盖子。
他还学习了与其他技能相关的抽象概念。比如能了解到柜内的光线是明亮的,以致于传感器都被点亮了。所以为了控制橱柜里的瓶子,灯必须关掉。还又为了关掉灯,要关掉橱柜门,因为打开的门挡住了他进入开关的通道。由此产生的抽象表示将所有的知识从高清晰度图像压缩到文本文件,只有 126 行。
Konidaris 说,这些都是关于他周围环境的重要的抽象概念,在打开门之前,必须先关好门。不能把瓶子从橱里拿出来,除非它是开着的等等,他能够通过执行技能和看到发生的事情来学习。
在抽象中做规划
Ana 掌握了抽象表现,研究人员让他做一些需要计划的事情,比方说把瓶子从冰箱里拿出来放到橱柜里。
正如他们所希望的那样,安娜去打开了冰箱,没有把里面瓶子拿出来,他意识到如果夹子里拿着瓶子,就不能打开橱柜,因为这样做需要两只手。所以打开冰箱后,就去了橱柜。然后看到灯开关在打开的位置,又意识到打开柜子会挡住开关,所以在打开橱柜前把开关关掉,回到冰箱里拿回瓶子,最后把它放在碗柜里。简而言之,他事先计划好了,发现了问题并在可能发生之前就把问题解决掉了。
Konidaris 说,「我们没有向 Ana 提供任何他需要的抽象表示,他自己就学会了这些抽象概念,一旦有了这些抽象概念,计划就变得简单了。他发现这个计划只需要 4 毫秒的时间。这项研究为将人工智能
应用于机器人技术提供了一个重要的理论基础,我们认为允许机器人在抽象而非具体的内容上进行规划和学习,将是构建真正智能机器人的基础。如果你以正确的方式思考,很多问题往往都很简单」。
这篇论文的合著者是来自麻省理工学院的 Leslie Pack Kaelbling 和 Tomas Lozano-Perez,这项研究得到了美国国防高级研究计划局和麻省理工学院的情报计划的支持。