爱吧机器人网 » 技术 > 模式识别 > 正文

语音交互什么时候可以渗透到生活中?

语音交互什么时候可以渗透到生活中?

从2011年10月4日,苹果在iPhone4s机型上开创性地配置Siri语音控制功能,并相继在2012年宣布支持中文语音识别和互动开始,语音助手浪潮首先在手机端应用掀起。

经过五年的发展,原本通过手动的人机交互模式已衍生出许多口令式应用场景,与此同时,在炙手可热的智能家居市场中,以语音交互为基础的人机互动模式也逐步成为标准性功能配置。

虽然,语音交互领域俨然被吹捧为又一智能蓝海、智能领域的入口之一,国内外科技大佬也因此没少在其投钱。

然而,回到现实应用场景里,我们当中有多少人真的像手动触屏操作那样信任语音助手?一天中有多少次开启过语音互动功能?从我们身边的用户和自身的使用习惯看,用户对语音操控仍然极度缺乏信任。

当今语音技术格局

从语音智能生态系统来看,主要有基于Nuance的苹果Siri与三星S-Voice、谷歌Android的Google Now、微软Windows Phone的Cortana三大版图。专注于中文语音智能领域而言:

以传统的语音技术提供商科大讯飞为首,无论在技术还是市场者占有领先地位,已知的合作厂商如京东微联、锤子科技、长虹、创维、三星等家电厂商;

腾讯,百度两大科技巨头也通过其团队实力的优越性展现了后来者居上的姿态;

苏州思必驰,捷通华声,云知声等相对较年轻的技术服务商在整体识别率十分抢眼;以及一些背靠其他学术或技术团队的小公司也正在积聚力量。

基础:手机使用场景

从iPhone的Siri开始,通过语音助手在手机上实现读短信、介绍餐厅、询问天气、设置闹钟、自然语言输入、调用天气预报、日程安排、搜索资料等功能已不再新鲜,通过后期的技术迭代,学习新的声音和语调,提供对话式的应答等能力也不在话下。

同时,在应用类层面,如微信、新浪微博、语音搜索、365日历、掌阅、91熊猫看书以及各大导航类应用也全面引入了语音识别、语义理解等功能。

潜力:家居物联网

随着物联时代的兴起,家居物联这块蓝海市场也吸引了众多科技公司的押注,而其最基本的接入方式。

在国外,三大科技大佬已开始布局,苹果就在今年6月初的苹果全球开发者大会(WWDC)上,推出了自家首个智能家居平台Homekit,其亮点也正是整合了Siri——具有语音控制功能,对于借用第三方应用或其它硬件而实现智能操控的国内智能家居系统无疑更容易打动用户。

与此同时,微软近日也宣布将把微软语音助手Cortana引入家庭自动化设备制造商Insteon在Windows Phone的应用程序中。

而谷歌早在去年也通过收购收购Nest Labs成功进军智能家居市场,并在今年5月份的谷歌I/O开发者大会上推出了以Android为核心的Brillo系统,以及Google Now新的智能应用功能。

国内市场方面,借由语音交互功能作为物联家居的入口、以及通过类似布丁机器人等家庭机器人的人机语音互动入驻智能家居等模式也屡见不鲜。

所谓的“标配”真的实用吗?

如果仅从配置要求方面而言,如上所述,语音智能技术确实已成为主流,但根据相关数据显示这一功能的使用率并不高。

在大多数情况下,语音交互变成了消遣娱乐的“游戏”,并未成为真正帮助人们操控设备的工具。究其原因,笔者认为主要在以下几个方面:

1. 语音识别率、语义理解力不足。虽然国外有迭代数次的苹果Siri语音助手、以及谷歌、微软等硬实力派的加盟,但据业界人士表示,从目前语音识别率提升至99%甚至100%的路还很长。这主要是语音易受场合、情绪、身体状况、内容上下文等影响的特性决定;

2. 中文语音的复杂性。由于中文的复杂性,其语音、语调、方言等多重因素的影响,造成汉语语音识别比英语在准确性更具挑战,以及在不同的语境内使用不同的字和语气,甚至包括隐语之类的东西,在英文里都是很少有的,所以偏重英文识别性能的外国技术在中文语音识别和语义理解方面显得“水土不服”,而这一点也需我国自主技术厂商的努力;

3. 缺少极为匹配的应用场景。虽然智能语音功能已在车载、智能家居、手机端等场景中实现,但更多的情况是为了添加语音互动功能而硬造出的应用场景;与此同时,不同机型在语音识别率、反应速度、功耗方面差异巨大且存在诸多问题,这一点使得智能语音功能在产品应用上更显鸡肋;

4. 此外,为使用户更好地实现语音操作的过渡和转化,在语音技术与触控、体感等其他操控方式的结合也显得十分重要,如果简单地将之定位于触摸、按键等主流操作方式的替代品,必将导致较低的市场接受。

目前的语音操控仍面临很多亟待解决的问题,用户实际应用情况并不像其产品覆盖面那样广泛,即所谓的语音智能还并不能称之为真正的标配。

但不可否认,语音交互已作为人机交互发展的重要方向,正逐步渗入到我们的日常生活与应用当中,引起了智能硬件行业的变革。

而谁能率先为智能语音交互创造更人性化的操作体验,在其算法的准确率、反应时间以及处理性能进行实质性的突破,定将为智能领域的发展创造丰厚的附加值。


上一篇:Face++CEO印奇:怎样做好人脸识别
下一篇:中国人脸识别水平可比肩美国、以色列
精选推荐
如何让人工智能机器人快速自我纠正错误并吃一堑长一智?
如何让人工智能机器人快速自我纠正错误并吃一堑长一智?

[2017-08-23]  莱斯特大学数学系的研究人员在《Neural Networks》杂志上发表了一篇文章,概述了新算法的数学基础,可以使人工智能收集错误报告并立即纠正,而不影响现有技能 ,同时还会积......

7种常见的机器人焊接类型
7种常见的机器人焊接类型

[2017-12-17]  机器人焊接是工业领域最常见的机器人应用之一,近几十年来主要由汽车行业驱动。机器人焊接在完成大批量,重复性的焊接任务时效率最高。...

瑞士研发出微型机器人集群 可像蚂蚁一样互相交流并协同工作
瑞士研发出微型机器人集群 可像蚂蚁一样互相交流并协同工作

[2019-07-12]  EPFL(瑞士联邦理工学院)的研究人员受到了蚂蚁的启发,开发了一款仅有10克重的小型机器人:他们可以相互交流,分配角色并完成复杂的任务。 ...

苹果AI主管透露自动驾驶汽车项目关于机器学习方面的进展
苹果AI主管透露自动驾驶汽车项目关于机器学习方面的进展

[2017-12-11]  苹果隐秘的自动驾驶汽车项目多年来一直在转移焦点,但今年似乎正在加速。 4月份,公司获得了在加利福尼亚州进行自动驾驶汽车测试的许可证,而在6月份,苹果公司首席执行官库......

一个让深度学习惨败的通用人工智能领域——语境处理
一个让深度学习惨败的通用人工智能领域——语境处理

[2019-11-04]  Context是指用来解释一段给定文本或语句的来源框架,我们可以翻译为上下文或语境。维基百科将context定义为:*在符号学、语言学、社会学和 ...

麻省理工学院最新研究:优化软体机器人的控制和设计
麻省理工学院最新研究:优化软体机器人的控制和设计

[2019-11-24]  软体机器人属于一个新的领域,它可能在诸如外科手术等领域发挥重要作用(手术时的纳米机器人需要在人体内部移动而不损伤软组织)。软体机器 ...

这个外科手术机器人可以为患者“量身定制”
这个外科手术机器人可以为患者“量身定制”

[2019-07-12]  世界首创,来自澳大利亚机器人视觉研究中心的研究人员正在推动手术机器人的发展边界,他们创造了可定制的、小型化的手术机器人,能够唯一地 ...

美国Natilus公司试飞水上无人货机 设计简单成本降低
美国Natilus公司试飞水上无人货机 设计简单成本降低

[2017-12-28]  Natilus创业公司成立于2014年,其梦想是建造大型无人机,以半价提供比船舶快得多国际货运。在十二月份,Natilus计划在旧金山湾测试一个9米翼展的小型原型无人机的水上滑行能力......

本周栏目热点

生物识别技术那么多,为啥偏偏“刷脸”火了

[1970-01-01]   你走到一家自助银行前,摄像头通过刷脸,自动识别你的身份为你开门;你站到ATM机前输入密码,再在摄像 ...

从原理入手,解析基于DSP的汉字语音识别系统的实现方式

[1970-01-01]   语音识别是机器通过识别和理解过程把语音信号转变为相应的文本文件或命令的高技术。作为专门的研究领域 ...

新剪刀手识别技术 虽然现在还不是很准确-模式识别

[2016-03-11]   在几年前的时候,指纹识别看上去还是一项非常高端的技术。的确,这可以让我们在工作和生活当中的很多事 ...

谷歌为何力推虹膜技术 分析其背后的价值链条-模式识别

[2015-12-11]   指纹识别、人脸识别技术正在趋于成熟,也正在被应用到更丰富的场景,逐渐改变我们生活的方方面面。但在 ...

宝马联合三星与松下 研发智能语音识别系统

[2015-12-28]   据美国媒体Autoevolution12月22日报道,宝马、三星和松下三家公司近日与语音识别公司Nuance合作开发新 ...