爱吧机器人网 » 资讯 > 行业新闻 > 正文

在“阅读理解”这件事上,AI再次把人类甩在了身后

\
题图来自:视觉中国

  提起阅读理解这四个字,你会想到什么?

  被四六级雅思托福支配的恐惧?语文试卷上连原作者都搞不懂的选择题?

  不管哪种答案,肯定都逃不出一个规律:进行阅读理解这项有益身心运动的主体,必然是跟你我一样的人类。

  毕竟嘛,这东西需要阅读一大段文字,然后理解了意义之后再做题目,堪称一场考试中最复杂最费脑筋,也最考验综合能力的一个环节。所以你的英语老师一定说过这样一句话:得阅读理解者得天下。

  然而,可是,但是,如果告诉你今天得这个天下的已经不再是人类,而是AI了,你会怎么想?也许此前我们想象过单词听写、句子翻译甚至写作都可以被AI完成,但是阅读理解这件事人类已经被甩在了AI身后,大概很多人都没想到。

  可事实就是这样,1月11日,斯坦福大学著名的机器阅读理解赛事SQuAD刷新了全球排名,阿里巴巴凭借82.440的精准率打破了世界纪录,超越了人类82.304的平均得分。

  当然了,AI是不会去跟你比托福刷分的,这件事的背后,脑洞有点大哦…

  什么是机器阅读理解?

  机器阅读理解,虽然看起来只是让AI上阵来一场考试。但是却是自然语言处理技术中,继语音判断、语义理解之后最大的挑战:让智能体理解全文语境。

  而斯坦福大学发起的SQuAD挑战赛,则是业内公认的机器阅读理解最高水平赛事。

\

  SQuAD挑战赛的基本规则,是通过众包的方式构建一个包含10万个问题左右的大规模数据集,并给出来源于维基百科长度大约在几百个单词左右的文章。参赛者提交的AI模型在阅读完数据集中的一篇短文之后,回答若干个基于文章内容的问题,答案与标准答案进行比对,最终得出成绩。

  由于阅读理解这项“智能”调整,需要运用到大量逻辑、细节和结构分析能力,并且直接作用于现实中的文本资料,所以实际价值很大。

  比如说,我们首先要面对的问题就是,假如人工智能已经比人类平均水平更擅长在对文本中精准信息进行理解和回答,会带给我们什么呢?

  当AI的“阅读理解”得分超越人类,意味着什么

  举个例子或许可以很简单的理解这个问题:英语考试上,当机器可以翻译单词的时候,我们一点都不惊奇;但机器可以听写整句话的时候,我们会感叹技术进步了;当机器自己做阅读理解的时候,我们大概会想:还要我考这个试干什么?

  这里面的差别,在于处理阅读理解相关问题时,AI不只是要运算和记录,而是要主动去分析和理解,所以阅读理解问题一直被人问是NLP的标志性临界点。但这个点被AI破解,直接意味着很多必须人类才能完成的工作已经正式能够被AI接管。

  因为阅读理解问题,不只是要处理语音和简单的语义,而是要理解和关注词汇、语句、篇章结构、思维逻辑、辅助语句和关键句等等元素构成的复杂组织网络。
\

  机器阅读理解“达标”,最直接的产业影响,是大多数今天还必须由人工完成的规则、对话、服务信息类的相关理解工作,都可以被人工智能所取代。比如说客服、信息管理和推荐类的工作,都可以考虑用不妙不休、高运算速度的机器来取代。

  机器阅读理解如何工作

  或许我们都注意到了这样一个问题:今天的互联网世界,在变得越来越多文本内容,各种各样的信息爆炸而来。太多你知道的、你不知道的、你以为自己知道的却实际不知道的事情呼啸而过。甚至你双11想要剁个手,都有各种各样的游戏规则等着你。自己读吧,太累太痛苦还没时间,问客服吧,很可能出错还很慢,简直是薛定谔式问题。

  这里或许就可以用机器阅读理解来解决了。比如客户对某个电商促销规则有疑问,就可以直接向AI提问,而AI就可以把这个问题当做一道阅读理解问题来进行解决方案回馈。

  机器阅读理解能力,将在如何向客户提供非模板式的智能客服服务中发挥作用。而当AI在这些能力上超越人工,那么机器客服的利用价值将可能快速提升。换句话说,机器客服终于可以不那么机器了……

  由此不难看出,这种关键能力的标杆性突破,对大量强调与普通消费者交互的产业线益处最多。

  推而广之,机器阅读能力也是文娱领域进行内容寻找和推荐的有效方式,比如阅读用户提出的复杂需求,进行精准推荐;与IoT产品相结合,给出对用户大段语言的回馈,乃至对话互动,都必须以机器理解能力为依托。

  理解力,让我们在未来面前不仅是个孩子

  除了知道AI可以充当更好的客服之外,究竟我们为什么应该关注机器阅读理解这件事?或许关键,是我们应该知道“理解力”在目前AI世界中的重要程度和期待指数。

  AI作为一种从计算机科学下的分支,一个智能体先天具备的是运算能力,而希望进行仿人类智慧的智能模拟,第二步就是模仿人类的感知。今天我们看到的机器视觉、语音识别、语义理解,都是在做这件事。而第三步,就是让AI产生理解力。

  显然,识别有着庞大的 应用 场景,并会在接下来很长一段时间内占据主流。但是AI的理解能力是大多数识别能力的进化,假如单纯的识别出却无法产生输出,那么AI无非是更灵活的传感器而已。

  从这个逻辑上看,阅读理解这道题绝不仅仅是个测试,或者商业应用的技术加持,更重要的是开启AI纪元里理解力的加速器。

  更广阔的意义在于,我们或许距离永远不用测试机器阅读理解更近了一步。当我们不再考虑机器是否能理解人类文本和语言,那么DeepNLP将可能达成,人机交互的范围将级扩大。机器智能可以开始捕捉人类的逻辑和函指。

  可能那还很远,也可能很近,但机器理解力让我们在未来面前不止是个孩子,应该是毫无疑问的。

上一篇:人工智能在制造业的三大应用方向
下一篇:我国将加快制定智能制造产品标准 为产品质量护航
精选推荐
智能机器人困惑的时候知道该问什么问题
智能机器人困惑的时候知道该问什么问题

[2017-03-20]   照片:Nick Dentamaro 布朗大学 上周,我们提到了麻省理工学院的一些研究,即通过链接人的大脑来帮助机器人在他们将要犯错误的时 ...

美国普渡大学研发快动作软体机器人,灵感来自变色龙舌头捕食
美国普渡大学研发快动作软体机器人,灵感来自变色龙舌头捕食

[2019-10-31]  本文图片均来自:Ramses v Martinez 普渡大学变色龙、蝾螈和许多蟾蜍利用积蓄的弹性能量,向距离1 5倍体长的毫无防备的昆虫伸出粘糊糊的舌 ...

亚马逊计划建一个4000万美元的机器人中心
亚马逊计划建一个4000万美元的机器人中心

[2019-11-07]  爱吧机器人网消息,亚马逊11月6日宣布了一项计划,计划在美国马萨诸塞州韦斯特伯勒建立一个4000万美元、35万平方英尺的机器人创新中心。新 ...

机器人iCub作为嵌入式AI的标准机器人研究平台的重要性
机器人iCub作为嵌入式AI的标准机器人研究平台的重要性

[2017-12-24]  机器人的研究在过去10年中得益于一个具有嵌入式人工智能(AI)的标准化开源平台——人形机器人iCub。iCub最初在意大利被创建,如今在欧洲、美国、韩国、新加坡和日本的实验室......

谷歌大脑发布ROBEL基准 鼓励用低成本机器人训练AI系统
谷歌大脑发布ROBEL基准 鼓励用低成本机器人训练AI系统

[2019-10-11]  训练AI系统的机器人D& 39;Claw和D& 39;Kitty用于控制机器人的人工智能系统,测量其性能所使用的基准通常仅限于为工业环境设计的昂贵硬件, ...

英伟达用联合学习创建医学影像AI 可共享数据和保护隐私
英伟达用联合学习创建医学影像AI 可共享数据和保护隐私

[2019-10-14]  英伟达(Nvidia)和伦敦国王学院(King’s College London)的人工智能研究人员利用联合学习训练了一种用于脑肿瘤分类的神经网络, ...

麻省理工正研究植物机器人 让植物自主控制机器人
麻省理工正研究植物机器人 让植物自主控制机器人

[2018-12-08]  控制论通常指人类用机器人部件增强自己。我们听说过动物机器人或昆虫机器人,但我们很少听说植物机器人对吧?一个机器人其实是对植物有很大益处的,因为一般植物根本无法移动......

研究人员融合人类与AI的创造力 显著提高了深度学习的表现
研究人员融合人类与AI的创造力 显著提高了深度学习的表现

[2019-10-12]  由加拿大人工智能领域研究主席、滑铁卢大学系统设计工程教授Alexander Wong领导的一个团队开发了一种新型紧凑型神经网络家族,可以在智能 ...

本周栏目热点

工业机器人视觉功能详解

[2018-09-21]  视觉堆垛程序通过相机视野内目标比例的变化来估算目标的高度并引导机器人的运动补偿目标的偏移,不但包括X轴,Y轴和X-Y平面旋转度R,也同时包括Z轴。...

协作•物联——机器人描绘汽车未来智能工厂

[2016-09-03]     8月24日至26日, 第十二届上海国际汽车制造技术与装备及材料展览会(AMTS 2016)在上海新国际博览中心盛大举行。全球领先的 工业机器人 ...

美国情报部门:量子计算和 AI 成为国家安全的新威胁

[2018-12-15]  将核武器、恐怖主义和气候变化与量子计算、人工智能和物联网相提并论的情况并不多见,但美国政府认为,所有这些都将对未来美国国家安全构成“新的威胁”。...

[2016-01-04]     1月2日凌晨消息,《麻省理工科技评论》(MIT Technology Review)网站今日 ...

2016年值得期待的科技进步之社交机器人

[2016-01-07]     虚拟现实应用空间不断拓展   当前,虚拟现实技术吸引了全世界科技爱好者的极大兴趣。2016年,虚拟现实将逐步走进主流消费者市场,该领 ...