这跟以往直接拿数据培训 机器人 不太一样。
对于机器人来说,像人一样从语句中获取信息是很难的。因而在训练机器人之前,通常会有筛选培训资料的过程,方便机器人在被喂入数据后,比较容易在大量资料中找到模块化的信息。
这种培训方式,对于计算机技术比较合适,只需要时间累积,但对于人们常用的语言来说,却是个麻烦。
这跟人们的表达方式有关系。宾夕法尼亚大学计算机和信息科学的助理教授ChrisCallison-Burch称:“自然语言的诸多难点之一在于,你可以用很多不同的方式来表达同样的信息,而抓住所有的这些变化,就是建立一个复杂模型过程中面临的挑战之一。”
说的直白点,就是人类所用的语言比较复杂,不能直接用作机器人的培训资料。
但Regina Barzilay等3位麻省理工学院研究人员最近想到了一个新角度,他们想让机器人自己从网上寻找信息,像人一样找更多资料做信息的补充。对于研究来说,这样做的好处最直接的是可以减少前期的人力成本。
简单来说,他们使用了人工智能的一种技术——强化学习,做了两个
应用 场景的测试。其一是在美国枪击案的新闻中找资料,包括枪击地点、伤亡人数;另外一个则是搜集食品造假事件的相似性,包括食品种类、食品造假的类型和地点。
每个测试都只使用300份新闻。但在测试中,麻省理工学院培训的机器人每分析1篇文章,它都会从网上找9、10篇新闻作为相关资料进行分析,以补充原本资料的不足。其中的困难之处在于,让机器人判断两篇新闻描述了同一件事,并且从多份资料中提取数据。
论文中举了一个谋杀案的案例,下面是3个新闻中摘出来的片段:
警官在周一公布称,一对夫妇和四个小孩死在他们位于南达科他州的家里,他们的家发生了火灾,他们显然是死于入室谋杀……一份官方声明称,Scott Westerhuis的死因是“疑似自杀性质的猎枪枪击”。
官方称,一个南达科他州家庭的6名成员被发现死在了火灾烧毁的家中,他们死于枪击,其中有一例死亡怀疑是自杀。
AGJackle称,所有的证据都支持他基于9月份的初步发现做的推理:Scott Westerhuis用一把猎枪枪杀了他的妻子和孩子,点燃了他的房子,然后用猎枪自杀。
最终,他们培训的机器人需要在网上找到类似下面2篇那样的新闻,并且挖出这两个信息:开抢的人是Scott Westerhuis,以及死亡人数是6人。
在两项测试中,麻省理工学院开发的系统能根据那些与目标信息相关的词汇进行搜索,例如枪击案的凶手通常会跟“警方(police)”、“确认(identified)“、”逮捕(arrested)“等词汇有关系,从而判断具体的人。
麻省理工学院的研究员称,他们用这种新技术做数据整理,准确率要比以往的筛选方式高出10%。不过,对于普通人来说,这种新技术看起来有趣的一点是,它让机器人的工作方式更接近于人类的思考方式:获取一个信息后,用更多的信息补充它。