近年来,随着计算机和网络技术的快速发展,诸多大规模知识引擎的创建在很大程度上改变了人类的知识共享和表征生态。受此启发,美国康奈尔大学和斯坦福大学的一些学者通过多模态大数据挖掘,创建了一种新的、主要面向机器人的、同时能供任何要执行任务的设备自由访问的大规模知识引擎:机器人大脑(RoboBrain)。
机器人大脑:面向机器人的大规模知识引擎
在面向人类的知识数据库中,信息搜索是一件简单的事情,我们只需在电脑或移动终端上输入几个字就可以得到答案,在很多情况下,模糊和缺省检索也能解决问题。但是,对于机器人来说事情就没有这么简单。即便要完成最简单的任务,机器人都需要详尽甚而完备的操作细节。基于面向人类的搜索引擎所得出的搜索结果,机器人难以读懂。比如,要使机器人读懂“如何烘焙蛋糕”的搜索结果,除了指出常规的烘焙过程和步骤之外,还需要提供各种各样详尽的相关附带信息,如鸡蛋可以打破;打破鸡蛋流出的液体必须装在器皿如杯子里;杯子只有在杯口朝上的情况下才可以盛装液体;水来自水龙头,能够在壶或者微波炉里加热,且能够和蛋液混合等等。因此,要创建一个面向机器人的大规模知识引擎不是一件简单的事情。
在人工智能产业发展前景被普遍看好的当下,康奈尔大学和斯坦福大学联合创建了一个面向机器人的大规模知识引擎——机器人大脑,并为此创建了一个网站。这主要是一个供机器人学习和共享知识表征并执行多种任务的大规模知识引擎。
“机器人大脑”网站的首页显示,该知识引擎主要通过搜索互联网及其他一些数据来源学习各种概念:“它能解释自然语言文本,意象和录像;能运用其传感器来观察人类;且能通过与它们互动的方式来学习事物。”创建者相信,通过学习和共享大规模知识,不同的机器人能够在各种新情境下更快速敏捷地完成各种任务。“机器人大脑”的创建改变了机器人的深度学习方式。传统上,机器人学习的重心是规则学习。随着大数据时代的到来,机器人开始从规则学习转向多模态数据学习。
机器人大脑:使机器人深度学习成为可能
“机器人大脑”本质上是一个大规模众源(crowd-sourcing)大数据库,它所存储的知识来源多样,包括机器人在完成各种任务(如感知、计划和控制等)时所关涉的物理互动、万维网知识基础以及领先的机器人研究小组所创建的各种可学习性知识表征。
“机器人大脑”的创建在很大程度上改变了大数据挖掘过度依赖单一文本数据模态来源的现状。受制于技术局限性,面向人类的大规模知识引擎的数据来源主要是万维网中“结构化”的文本模态数据,而无法有效挖掘其他一些“非结构化”的数据模态如符号、图片、视频、音频等。“结构化数据”主要指能被数据库所理解的、可以被逻辑表征的数据,而“非结构化数据”主要指无法被逻辑表征的数据,主要包括多种数据模态:文本、图片或图像、触感、XML、HTML、各类图表或报表、音频和视频信息等等。
12
下一页>