爱吧机器人网 » 专题 > 观点 > 正文

想成为下一个BAT,还得搞语音交互?

自从人类发明了计算机,就持续面临着一个根本性问题:我们到底应该如何与这类机器交互?抛开具体交互形式不论,我们和机器的交互方式经历了一个从人适应机器,到机器适应人的过程。一旦趋势切换为机器应该如何适应人,那看待语音交互等最终趋势的视角,就不应该是机器能做什么,而是说人更渴望什么。

想成为下一个BAT,还得搞语音交互?

人机交互简史

自从计算机发明后,它所能接受的输入本质上就没发生任何变化,始终都是类似加减乘除移位这样的指令。我们经常说的纸带其实并不是交互方式本身,而只是一种载体,纸带上面就是具体需要计算机执行的指令。在那个时代,人是要完全适应机器的,所以必须学会机器的语言,程序员则相当于掌握了机器语言的翻译。

同样道理,键盘也不是一种交互方式,而是一种输入设备。真正的交互方式其实是命令,常见的比如mkdir这类命令,其实可以看成是更多指令的集合,但抽象的级别更高了,可以完成建立目录这类功能。这个时候,其实也还是人在适应机器,但开始去除人机交互过程中一些繁琐重复的事情,让人机交互变得更为便利。

此后图形用户界面的出现是一个关键转折。图形用户界面让人机交互彻底向人类一方迁移,屏蔽掉了几乎所有和机器相关的细节。在Windows下唯一还保留了些机器特征的东西,只是开机、关机、拷贝、粘贴、查找、最大化、最小化、关闭等少数几个命令,其它部分则和我们操作物理世界的东西很像。比如,我们需要选择一样东西的时候,我们通常会把他们排成一排,而不管开始菜单还是任务栏都是这样做的。

同样是图形用户界面,从使用鼠标到触屏还是有进展的,导入触屏之后机器的细节被进一步抛弃,最大化、最小化这些操作就消失了,而只剩下App的排列以及选择,我们最常用的操作只是点击和滑动。所以我们可以说从鼠标到触屏,其实是进一步向人这端迁移。

这背后本质的推动力其实是计算能力的富余,但产品设计者们不再让这部分富余计算能力只是用来提高性能,而是用来适应人的操作习惯,所以图形用户界面可以看成是从人适应机器到 机器人 适应人的转折点。这其实没什么奇怪,毕竟人类是世界的中心,所以只要有可能那就必然走到机器适应人的方向上来。

过去不管是用纸带直接输入指令,还是用命令行乃至于使用图形用户界面,其内部是逐步递进的,虽然表面看差异很大,但基于的是同样的命令体系,只是在便利性上有较大提升,并没有导入很多的新东西。

语音交互则与此不同,它一方面集成了老的命令系统。比如,你可以说调大音量、下一页、设定十点的闹钟等。这时候它体现的只是人机交互方式进一步向人这端倾斜,提升便利性,这与图形用户界面带来的变化是一致的。

但另一方面它则为交互方式注入了智能属性,这种智能属性让机器进行更多决策,交互不再是精确的。比如,放一首歌,这在过往的交互方式下是不能实现的。这是两种完全不同的属性,前者会让存量市场进行升级,也就是说只要便利性有价值,哪怕没什么智能它也是可以落地的,后者则体现新的信息整合和输出方式,会带来极大的颠覆性。

交互方式背后隐含的颠覆性

交互方式的改进,如果只是带来纯粹的便利性那就只是一个更好的功能,但如果这种交互方式影响了信息的整合与输出方式,那就会对行业产生颠覆性影响。典型的就是触屏对搜索的影响,在鼠标的模式下,搜索是互联网的中心,但因为触摸不能精确定位,进一步催生了App,这直接导致了搜索的中心地位被削弱。

很显然,注入了智能属性的语音交互,一定会导致信息整合和输出方式的再次更迭,那这会对眼下已经日趋稳定的互联网生态带来什么影响?

从现象上看,最直接的影响是App会消失了,信息的整合与输出看起来似乎会经历一个分久必合,合久必分的过程。图形用户界面的鼠标时代,信息的整合与输出其实是大一统的,基本上就是浏览器与搜索引擎,然后大的客户端程序维持一定自己的空间(比如QQ)。图形用户界面的触摸屏时代,信息的整合与输出其实是分散化的,人们得记住自己要什么然后装特定的App。语音交互则是更加大一统的,没有App同时也不会再有和浏览器相并列的大客户端,有的只是输入一句句话。

什么样技术趋势就会导致什么样的格局。形象地讲我们可以认为搜索、电商、IM的格局是先天内置在行业里面的,然后才是谁是搜索的王者,谁是电商的王者。

在PC时代浏览器和搜索处于核心地位,所以就会有Google这样的巨头,其它人都要活在它的阴影下面。而一旦信息的整合与输出再一次大一统化,那就一定会催生新的统治者,而这种统治者的出现,实质上意味着现有的巨头或者小巨头会被削弱。如果没有了App,对于O2O甚至出行服务来说,谁掌握了上层的控制权,谁就掌握了他们的命脉。

现在看来,终局会是这样,但这个过程非常漫长。

未来三年的交互方式发展

交互方式的发展一定依赖于具体产品的销售状态,而终端产品的销售起量则有两种模式:一种是智能手机式的,一种则是MP3式的。

智能手机的启动进程显然和苹果有巨大的关系,苹果先推出一款标杆产品,然后迅速出现大量的模仿者,最终市场大幅启动。在手机上整个过程历时4年~5年。MP3则与此不同,先是出现各种形状的MP3,没有领头羊,市场也启动了,然后苹果出了一款体验远超其它人的产品。

对语音交互的发展而言,我们同样面临两种可能性:一种是有人做出了一款足够爆款的产品,让语音交互的落地有一个符号性的标志,然后类似产品持续跟进,产品品类持续拓宽;一种是没什么标志性的产品,但交互方式极为宽泛、不停地在各个行业进行渗透,累积到一定程度再出各种标志性产品。国外显然走的是第一条路线,其中Amazon Echo扮演了领头羊角色。在国内则暂时还看不到这样一个角色,越来越往MP3的走势偏移。

具体来讲,如果是有人扮演领头羊的角色,那市场会在领头羊之后高速扩张,因为交互方式的一切细节都会在领头羊身上得到验证,各个公司不会有任何疑虑。但如果是没有领头羊的模式,那整个进程就会拖得比较漫长。

也就说未来三年交互方式的发展,最终会依赖于我们会走到哪条道路上来,眼下来看后者的可能性比较大。因为领头羊这种事,事实上是具有极大偶然性的,乔布斯这种人是难以复制的,其信徒们似乎都走上了邯郸学步的套路。

小结

过去,谁敢说自己是下一个BAT,其实是会被鄙视的,因为客观条件就不具备,小鱼塘里哪会出现鲸鱼。但现在交互方式似乎真的提供了这么一个机会,BAT其实也是这么想,所以这种颠覆性更可能只是巨头间势力的再分配。

上一篇:自动驾驶,一场呼声高涨的大跃进?
下一篇:“AI+”时代 | 未来计算:人工智能及其社会角色
精选推荐
谷歌《Nature》发论文称实现量子霸权 18亿倍速碾压世界最强超算
谷歌《Nature》发论文称实现量子霸权 18亿倍速碾压世界最强超算

[2019-10-23]  谷歌坚称自己已经取得了量子霸权——这标志着计算研究领域的一个重要里程碑。谷歌首次发布声明是在今年9月,虽然遭到竞争对手的质疑,但就 ...

英伟达用联合学习创建医学影像AI 可共享数据和保护隐私
英伟达用联合学习创建医学影像AI 可共享数据和保护隐私

[2019-10-14]  英伟达(Nvidia)和伦敦国王学院(King’s College London)的人工智能研究人员利用联合学习训练了一种用于脑肿瘤分类的神经网络, ...

助力卷积神经网络时空特征学习 史上最大行人重识别视频数据集被提出
助力卷积神经网络时空特征学习 史上最大行人重识别视频数据集被提出

[2017-12-25]  本文提出了一个大型的、长序列的、用于行人重识别的视频数据集,简称LVreID。与现有的同类数据集相比,该数据集具有以下特点:1)长序列:平均每段视频序列长为200帧,包含丰......

谷歌大脑发布ROBEL基准 鼓励用低成本机器人训练AI系统
谷歌大脑发布ROBEL基准 鼓励用低成本机器人训练AI系统

[2019-10-11]  训练AI系统的机器人D& 39;Claw和D& 39;Kitty用于控制机器人的人工智能系统,测量其性能所使用的基准通常仅限于为工业环境设计的昂贵硬件, ...

南加州大学机器人学家:机器人更适合粗暴的爱
南加州大学机器人学家:机器人更适合粗暴的爱

[2019-11-07]  图片来自JOHN MADERE GETTY IMAGES打是疼骂是爱,当人类粗暴的将物体从机器人手中敲掉,看似残忍,实际上却能帮助机器人找到最好的握持物 ...

美国人工智能公司Skymind进入福建全面开展业务
美国人工智能公司Skymind进入福建全面开展业务

[2017-12-11]  人工智能在当今这个时代对大家来说想必是非常熟悉的,这也是我国近十几年来一直追求的目标,未来的时间里这也将是全人类追求的目标。就目前来看,近年来,人工智能或在我国迎......

CES 2018:英特尔推出49量子位芯片争夺量子霸权
CES 2018:英特尔推出49量子位芯片争夺量子霸权

[2018-01-10]  在与Google、IBM的一场关于建立量子计算系统的马拉松比赛中,英特尔通过了一个关键的里程碑。近日,这个科技巨头已经推出了一个49个量子位 ...

2018年企业数字化转型的五大趋势
2018年企业数字化转型的五大趋势

[2017-12-16]  据2016年哈佛商学院研究表明,选择进行数字化转型的企业在3年内表现出了55%的平均毛利润提升,相比之下其他企业毛利润同期降低了37%。数字化转型企业的领头羊,也曾是收入处于......

本周栏目热点

2020年中国AI基础数据服务行业发展报告

[2020-04-03]  核心摘要:目前人工智能商业化在算力、算法和技术方面基本达到阶段性成熟,想要更加落地,解决行业具体痛点, 需要大量经过标注处理的相关 ...

[1970-01-01]    从首尔清潭洞SM娱乐公司大楼代表办公室的落地窗可以清晰地眺望对面的汉江。李秀满会长介绍拥有代表办公室和录音室的建筑物是工作室中心 ...

[1970-01-01]    虽然我国经济增速下降,通缩若隐若现,但由于我国劳动力人口在2012年已经达到顶峰,之后总量呈逐年下降之势,所以即使近几年产业工人工 ...

腾讯思享会:探讨智能社会与人类未来

[1970-01-01]    人类在享受开车的过程时,在不久的将来可能让机器开车,人类如不是理性的控制机器人,又将一场持久的大战。  以智能社会与人类未来为 ...

[1970-01-01]    机器人发展到今天到了重新定义的时候,机器人拥有人类的感知和思维、应用到更多领域,成为现代机器人产业发展的新方向,由此看出中国机 ...