爱吧机器人网 » 技术 > 模式识别 > 正文

语音交互什么时候可以渗透到生活中?

语音交互什么时候可以渗透到生活中?

从2011年10月4日,苹果在iPhone4s机型上开创性地配置Siri语音控制功能,并相继在2012年宣布支持中文语音识别和互动开始,语音助手浪潮首先在手机端应用掀起。

经过五年的发展,原本通过手动的人机交互模式已衍生出许多口令式应用场景,与此同时,在炙手可热的智能家居市场中,以语音交互为基础的人机互动模式也逐步成为标准性功能配置。

虽然,语音交互领域俨然被吹捧为又一智能蓝海、智能领域的入口之一,国内外科技大佬也因此没少在其投钱。

然而,回到现实应用场景里,我们当中有多少人真的像手动触屏操作那样信任语音助手?一天中有多少次开启过语音互动功能?从我们身边的用户和自身的使用习惯看,用户对语音操控仍然极度缺乏信任。

当今语音技术格局

从语音智能生态系统来看,主要有基于Nuance的苹果Siri与三星S-Voice、谷歌Android的Google Now、微软Windows Phone的Cortana三大版图。专注于中文语音智能领域而言:

以传统的语音技术提供商科大讯飞为首,无论在技术还是市场者占有领先地位,已知的合作厂商如京东微联、锤子科技、长虹、创维、三星等家电厂商;

腾讯,百度两大科技巨头也通过其团队实力的优越性展现了后来者居上的姿态;

苏州思必驰,捷通华声,云知声等相对较年轻的技术服务商在整体识别率十分抢眼;以及一些背靠其他学术或技术团队的小公司也正在积聚力量。

基础:手机使用场景

从iPhone的Siri开始,通过语音助手在手机上实现读短信、介绍餐厅、询问天气、设置闹钟、自然语言输入、调用天气预报、日程安排、搜索资料等功能已不再新鲜,通过后期的技术迭代,学习新的声音和语调,提供对话式的应答等能力也不在话下。

同时,在应用类层面,如微信、新浪微博、语音搜索、365日历、掌阅、91熊猫看书以及各大导航类应用也全面引入了语音识别、语义理解等功能。

潜力:家居物联网

随着物联时代的兴起,家居物联这块蓝海市场也吸引了众多科技公司的押注,而其最基本的接入方式。

在国外,三大科技大佬已开始布局,苹果就在今年6月初的苹果全球开发者大会(WWDC)上,推出了自家首个智能家居平台Homekit,其亮点也正是整合了Siri——具有语音控制功能,对于借用第三方应用或其它硬件而实现智能操控的国内智能家居系统无疑更容易打动用户。

与此同时,微软近日也宣布将把微软语音助手Cortana引入家庭自动化设备制造商Insteon在Windows Phone的应用程序中。

而谷歌早在去年也通过收购收购Nest Labs成功进军智能家居市场,并在今年5月份的谷歌I/O开发者大会上推出了以Android为核心的Brillo系统,以及Google Now新的智能应用功能。

国内市场方面,借由语音交互功能作为物联家居的入口、以及通过类似布丁机器人等家庭机器人的人机语音互动入驻智能家居等模式也屡见不鲜。

所谓的“标配”真的实用吗?

如果仅从配置要求方面而言,如上所述,语音智能技术确实已成为主流,但根据相关数据显示这一功能的使用率并不高。

在大多数情况下,语音交互变成了消遣娱乐的“游戏”,并未成为真正帮助人们操控设备的工具。究其原因,笔者认为主要在以下几个方面:

1. 语音识别率、语义理解力不足。虽然国外有迭代数次的苹果Siri语音助手、以及谷歌、微软等硬实力派的加盟,但据业界人士表示,从目前语音识别率提升至99%甚至100%的路还很长。这主要是语音易受场合、情绪、身体状况、内容上下文等影响的特性决定;

2. 中文语音的复杂性。由于中文的复杂性,其语音、语调、方言等多重因素的影响,造成汉语语音识别比英语在准确性更具挑战,以及在不同的语境内使用不同的字和语气,甚至包括隐语之类的东西,在英文里都是很少有的,所以偏重英文识别性能的外国技术在中文语音识别和语义理解方面显得“水土不服”,而这一点也需我国自主技术厂商的努力;

3. 缺少极为匹配的应用场景。虽然智能语音功能已在车载、智能家居、手机端等场景中实现,但更多的情况是为了添加语音互动功能而硬造出的应用场景;与此同时,不同机型在语音识别率、反应速度、功耗方面差异巨大且存在诸多问题,这一点使得智能语音功能在产品应用上更显鸡肋;

4. 此外,为使用户更好地实现语音操作的过渡和转化,在语音技术与触控、体感等其他操控方式的结合也显得十分重要,如果简单地将之定位于触摸、按键等主流操作方式的替代品,必将导致较低的市场接受。

目前的语音操控仍面临很多亟待解决的问题,用户实际应用情况并不像其产品覆盖面那样广泛,即所谓的语音智能还并不能称之为真正的标配。

但不可否认,语音交互已作为人机交互发展的重要方向,正逐步渗入到我们的日常生活与应用当中,引起了智能硬件行业的变革。

而谁能率先为智能语音交互创造更人性化的操作体验,在其算法的准确率、反应时间以及处理性能进行实质性的突破,定将为智能领域的发展创造丰厚的附加值。


上一篇:Face++CEO印奇:怎样做好人脸识别
下一篇:中国人脸识别水平可比肩美国、以色列
精选推荐
2018年企业数字化转型的五大趋势
2018年企业数字化转型的五大趋势

[2017-12-16]  据2016年哈佛商学院研究表明,选择进行数字化转型的企业在3年内表现出了55%的平均毛利润提升,相比之下其他企业毛利润同期降低了37%。数字化转型企业的领头羊,也曾是收入处于......

研究人员融合人类与AI的创造力 显著提高了深度学习的表现
研究人员融合人类与AI的创造力 显著提高了深度学习的表现

[2019-10-12]  由加拿大人工智能领域研究主席、滑铁卢大学系统设计工程教授Alexander Wong领导的一个团队开发了一种新型紧凑型神经网络家族,可以在智能 ...

集群机器人领域最新研究:一种用于探测未知环境的微型无人机群
集群机器人领域最新研究:一种用于探测未知环境的微型无人机群

[2019-10-26]  (图:无人机扩散至不同方向来探索环境。当一个无人机注意到另一个无人机在它的首选方向,它将试图飞到另一个方向。若首选方向冲突,低优先 ...

这些人型机器人是如此真实,你的肉眼几乎无法区分
这些人型机器人是如此真实,你的肉眼几乎无法区分

[2017-09-03]   我们生活在一个区分现实与幻想变得越来越困难的世界。由于机器人技术的进步,创造人工的人类正在逐渐接近完美的最终目标。我们现在看到的机器人不再只是一块发光二极管,......

美国人工智能公司Skymind进入福建全面开展业务
美国人工智能公司Skymind进入福建全面开展业务

[2017-12-11]  人工智能在当今这个时代对大家来说想必是非常熟悉的,这也是我国近十几年来一直追求的目标,未来的时间里这也将是全人类追求的目标。就目前来看,近年来,人工智能或在我国迎......

亚马逊计划建一个4000万美元的机器人中心
亚马逊计划建一个4000万美元的机器人中心

[2019-11-07]  爱吧机器人网消息,亚马逊11月6日宣布了一项计划,计划在美国马萨诸塞州韦斯特伯勒建立一个4000万美元、35万平方英尺的机器人创新中心。新 ...

17世纪的莱布尼茨试图制造“思想机器”却被现实打脸
17世纪的莱布尼茨试图制造“思想机器”却被现实打脸

[2019-11-05]  莱布尼茨,德国哲学家、数学家、律师,历史上少见的通才1666年,德国博学家戈特弗里德·威廉·莱布尼茨(Gottfried Wilhelm Leibniz)发 ...

这个外科手术机器人可以为患者“量身定制”
这个外科手术机器人可以为患者“量身定制”

[2019-07-12]  世界首创,来自澳大利亚机器人视觉研究中心的研究人员正在推动手术机器人的发展边界,他们创造了可定制的、小型化的手术机器人,能够唯一地 ...

本周栏目热点

生物识别技术那么多,为啥偏偏“刷脸”火了

[1970-01-01]   你走到一家自助银行前,摄像头通过刷脸,自动识别你的身份为你开门;你站到ATM机前输入密码,再在摄像 ...

从原理入手,解析基于DSP的汉字语音识别系统的实现方式

[1970-01-01]   语音识别是机器通过识别和理解过程把语音信号转变为相应的文本文件或命令的高技术。作为专门的研究领域 ...

新剪刀手识别技术 虽然现在还不是很准确-模式识别

[2016-03-11]   在几年前的时候,指纹识别看上去还是一项非常高端的技术。的确,这可以让我们在工作和生活当中的很多事 ...

谷歌为何力推虹膜技术 分析其背后的价值链条-模式识别

[2015-12-11]   指纹识别、人脸识别技术正在趋于成熟,也正在被应用到更丰富的场景,逐渐改变我们生活的方方面面。但在 ...

宝马联合三星与松下 研发智能语音识别系统

[2015-12-28]   据美国媒体Autoevolution12月22日报道,宝马、三星和松下三家公司近日与语音识别公司Nuance合作开发新 ...