爱吧机器人网 » 技术 > 模式识别 > 正文

智能语音五大难题悬而未决,变革终端产业先谈附属再谈颠

智能语音应用正走向成熟,终端产业正迎来一波以智能语音控制为特色的全新革命。那么智能语音能否颠覆未来终端产业?其中的机遇和挑战又在哪里?

众所周知,语音导航、语音拍照、语音拨号、语音唤醒等功能如今已经风靡各种终端,智能语音操控已经从最初消费者无聊时的调侃型应用,发展到如今可真正帮助消费者解决实际问题的功能性应用。智能语音应用正走向成熟,终端产业正迎来一波以智能语音控制为特色的全新革命。那么智能语音能否颠覆未来终端产业?其中的机遇和挑战又在哪里?钛媒体作者孙永杰详细梳理和解读关于智能语音将面临的五大难题:

第一、智能语音会是下一代终端的“标配”吗?

这里的关键在于如何定义和理解“标配”。如果从带有语音功能的角度,现在几乎主流智能手机厂商的主流智能手机都具有一定程度的语音功能。而从大的生态系统来划分的话,苹果iOS有Siri、谷歌Android有Google Now、微软Windows Phone有Cortana,当然除了这三大生态系统标配的智能语音应用外,还有所谓第三方开发的智能语音应用,例如目前比较知名的中兴智能语音。

但从使用频率看,我们认为目前所谓的智能语音仍未达到“标配”的要求或者说是目的。即既然是标配,就应该被用户频繁使用或者说某些应用非智能语音不可才有实际的价值。否则尽管智能手机上具备智能语音功能(仅表面的标配而已),但用户并不会在实际应用中去频繁使用,这种“标配”无论对于厂商的资源还是用户的付出价值都是一种浪费。所谓此标配非彼“标配”。

究其原因,我们认为,目前智能语音识别率不高或者识别上语义的曲解是阻碍用户使用智能语音的主要原因;其次就是智能语音支持的应用并非具有不可替代性(采用传统的触控方式仍可完成);最后就是智能语音使用的效率。即使用智能语音与传统触控相比,无论是在操作步骤、反应时间等构成的效率体验上并未体现出明显的优势。

语音 Siri

第二、智能语音的“实用派”与“娱乐派”,哪种用户更愿意买单?

需要说明的是,之所以提出这个问题,正是由于上述智能语音使用率不高,相关厂商在智能语音发展现阶段所采用的不同的鼓励和吸引用户尽可能使用智能语音的一种手段和发展策略。对于究竟谁优谁劣,业内是见仁见智。

结合当下智能语音使用率偏低及技术发展尚不成熟,尤其是缺乏不可替代性,我们认为“娱乐派”似乎更适合当下智能语音与智能终端(例如智能手机)的推广。因为一来可以增加用户使用的兴趣,进而间接提高使用的频率,加深对于智能语音的理解,同时也可以稀释因目前智能语音技术所限出现差错而给用户造成智能语音不可靠的负面影响。但有一点需要肯定的是,未来智能语音要想从根本上为用户所接受和普及,实用价值是不可或缺的。从这个意义看,目前“实用派”更符合未来发展的趋势。值得一提的是,在某些关键应用场景下,例如导航,搜索等应用,“实用派”已经是当下是惟一的选择。

第三、智能语音市场需要怎样的企业,“大而全”还是“小而精”?

这个问题,我们认为应该从两个维度看,一是从相关企业的发展策略,是做大而全的智能语音识别,还是针对某个行业或者应用。也就是说是做通用型的智能语音还是专业型的智能语音;另一个维度则是用户的需求。即用户是希望现有和未来终端的应用是全部由智能语音支持还是个别场景和应用需要智能语音支持。

从目前与厂商发展智能语音相关的技术、市场策略与用户需求的应用和场景的契合度上看,我们认为“少而精”应该是现在和未来一段时间内智能语音产业发展的特点和趋势,即便是像某些业内观点所言,未来智能语音技术高度成熟,也很难完全替代目前智能终端(例如智能手机,智能手表等)以触控为主的应用和体验,就像目前的触控不能替代鼠标键盘一样。所以,我们建议相关企业还是应仔细研究智能语音的使用场景和应用,把某些特殊场景(例如车载)和应用上做到极致,无论是对于自身,还是对于整个智能语音产业的促进上都将事半功倍。

第四、如何评判语音识别技术的高低?

尽管研讨中与会的专家、业内人士针对这个问题给出了不同的解答,但我们认为从用户需求和体验的角度去评判更具客观性。首先就是对于不同应用或者场景下对于语义的理解。在此我们之所以没有提及业内常言的识别,是因为作为智能语音,识别是最基本的要求,理解不仅包含了识别,更是识别后逻辑分析的产物。其次是反馈和处理的效率。有关这个我们在前面中已有所涉及,这里不再赘述。

最后是相关应用的和场景的优化与支持。需要提醒和补充的是,无论是语义的理解还是处理的效率,由于涉及到诸多领域和多种因素,所以绝非是一家企业可以搞定,这就要求产业链相关厂商的密切配合。这也是为何目前国内某些企业(例如中兴智慧语音联盟)采用结盟方式发展智能语音的主要原因。

第五、谁将引领下一个智能语音应用热潮?

这同样涉及到两个维度。首先是智能语音的应用领域。从目前看,多数厂商多集中在智能手机领域。毕竟目前智能手机是目前普及量、市场空间、应用等方面最大的市场,其次就是以智能手表为代表的可穿戴设备、车联网及未来的物联网(例如智能家居)。而鉴于业内公认的现在和未来智能手机是连接一切的中心,那么智能手机无疑重中之重,至少是下一个智能语音应用热潮本身及延展的基矗

另外一个维度就是相关厂商。而提及相关厂商,就必须联系应用领域,既然智能手机是链接一切的中心且是延展的基础,就决定了智能语音未来的发展方向应是平台化。即智能语音技术虽然以智能手机中的相关应用和场景为重,但又不应仅仅局限于智能手机,只有这样的企业方能引领下一个智能语音应用的热潮。

上一页12下一页

上一篇:图片搜索、移动支付、智能安防 人脸识别技术早就玩出花
下一篇:刷爆朋友圈的How-Old是怎么猜出你年龄的?
精选推荐
麻省理工最新机器人“装配工”未来可建造太空基地
麻省理工最新机器人“装配工”未来可建造太空基地

[2019-10-17]  两个机器人原型把一系列小单元组装成大结构体麻省理工学院科研人员最近提出一种新型机器人技术,即一种小型机器人系统,能够自主地用统一规 ...

谷歌在中国成立一个新的人工智能(AI)研究中心
谷歌在中国成立一个新的人工智能(AI)研究中心

[2017-12-13]  谷歌正在中国建立一个新的人工智能(AI)研究中心,希望进一步扩展到中国,以充分利用中国高度重视的人工智能技术。人工智能是目前地球上最具竞争力的领域之一,亚马逊,微软......

九台“猎豹”机器人组队踢球,麻省理工高材生们的高级趣味
九台“猎豹”机器人组队踢球,麻省理工高材生们的高级趣味

[2019-11-09]  本周,在麻省理工学院10号楼外草坪上展开了一场别开生面的足球比赛。在绿草如茵的基利安球场上,一群由人工智能驱动的机器人就是这场比赛的 ...

美国普渡大学研发快动作软体机器人,灵感来自变色龙舌头捕食
美国普渡大学研发快动作软体机器人,灵感来自变色龙舌头捕食

[2019-10-31]  本文图片均来自:Ramses v Martinez 普渡大学变色龙、蝾螈和许多蟾蜍利用积蓄的弹性能量,向距离1 5倍体长的毫无防备的昆虫伸出粘糊糊的舌 ...

通过对抗性图像黑入大脑
通过对抗性图像黑入大脑

[2018-03-02]  在上面的图片中,左边是一张猫的照片。在右边,你能分辨出它是同一只猫的图片,还是一张看起来相似的狗的图片?这两张图片之间的区别在于, ...

CES 2018:英特尔推出49量子位芯片争夺量子霸权
CES 2018:英特尔推出49量子位芯片争夺量子霸权

[2018-01-10]  在与Google、IBM的一场关于建立量子计算系统的马拉松比赛中,英特尔通过了一个关键的里程碑。近日,这个科技巨头已经推出了一个49个量子位 ...

助力卷积神经网络时空特征学习 史上最大行人重识别视频数据集被提出
助力卷积神经网络时空特征学习 史上最大行人重识别视频数据集被提出

[2017-12-25]  本文提出了一个大型的、长序列的、用于行人重识别的视频数据集,简称LVreID。与现有的同类数据集相比,该数据集具有以下特点:1)长序列:平均每段视频序列长为200帧,包含丰......

科学家从蟑螂获得启发 教机器人更好地走路
科学家从蟑螂获得启发 教机器人更好地走路

[2017-12-11]  Weihmann指出:“我特别感到惊讶的是,动物运动稳定机制的变化与腿部协调的变化是一致的。昆虫的慢运行非常稳定,因为它的重心很低,三条腿总是以协调的方式运动。...

本周栏目热点

生物识别技术那么多,为啥偏偏“刷脸”火了

[1970-01-01]   你走到一家自助银行前,摄像头通过刷脸,自动识别你的身份为你开门;你站到ATM机前输入密码,再在摄像 ...

从原理入手,解析基于DSP的汉字语音识别系统的实现方式

[1970-01-01]   语音识别是机器通过识别和理解过程把语音信号转变为相应的文本文件或命令的高技术。作为专门的研究领域 ...

新剪刀手识别技术 虽然现在还不是很准确-模式识别

[2016-03-11]   在几年前的时候,指纹识别看上去还是一项非常高端的技术。的确,这可以让我们在工作和生活当中的很多事 ...

谷歌为何力推虹膜技术 分析其背后的价值链条-模式识别

[2015-12-11]   指纹识别、人脸识别技术正在趋于成熟,也正在被应用到更丰富的场景,逐渐改变我们生活的方方面面。但在 ...

宝马联合三星与松下 研发智能语音识别系统

[2015-12-28]   据美国媒体Autoevolution12月22日报道,宝马、三星和松下三家公司近日与语音识别公司Nuance合作开发新 ...