爱吧机器人网 » 技术 > 模式识别 > 正文

语音识别领域的GitHub:Wit.ai让每个公司拥有自己的“Siri”

即便对苹果和Google这样的公司来说, 语音识别 也很难,两家公司都收集了大量实时语音数据,帮助开发Siri和Google Now的 算法 ,但效果不尽如人意。对小公司来说,打造 语音识别 应用就更加困难了,而且它们往往无法收集到大量的真实语音数据。而这就是Alexandre Lebrun的工作。

他创办的Wit.ai能将开发者的语音样本集合起来,帮助开发语音及 自然语言 识别系统,Lebrun认为他们的成果在尝试和广度上能与苹果和Google一较高下。这一平台也反映了一种趋势,即随着无屏幕的可穿戴设备的兴趣,越来越多的开发者会使用语音交互技术。

目前,Wit.ai已经吸引了数千开发者,而本周三它在种子轮中融资了300万美元。

发现问题

事实上,Wit.ai脱胎于Lebrun之前创立的公司VirtuOz,该公司专为AT&T等公司开发 语音识别 系统。但在工作中,Lebrun发现每开发一个新系统,一切都要重新开始。对每一个项目,他们都要收集新的语音样本以训练系统。虽然各项目的语音指令集有重叠的部分,但VirtuOz无法将一位客户的样本用于另一位客户项目。

结果是, 语音识别 效果并不完美,在体验上也十分糟糕。更重要的是,由于 语音识别 系统的设置费用相当高,服务商都不会解决小公司或开发者的需求。

去年,Lebrun将VirtuOz卖给了开发出Siri的 语音识别 公司Nuance,然后创立了Wit.ai。

如何运作?

一般而言, 语音识别 系统的开发会从“语法”(想要计算机识别的语句的集合)开始,然后开发者会使用尽可能多的语句发音样本“训练”计算机,让其识别语法。由于用户指令各异,同一需求有多种表达方式,所以语法要尽可能多。

Wit.ai所做的是让公司共享语法和训练数据,就像GitHub让软件开发者共享代码一样。开发者能对GitHub上的代码进行更改,而Wit.ai上的语法也能用于开发不同的应用。

Wit.ai的商业模式也与GitHub相同,用户会免费分享数据。不过为了保护隐私,用于训练系统的音频记录不能共享,而不愿共享语法或数据的公司可以付费使用该公司服务。

免费

与Wit.ai一样,现在有越来越多的公司和项目能帮助开发者在各自的应用上布署 语音识别 系统,其中有开源项目Julius和CMU Sphinx,也有Google的语音转文本服务。Lebrun希望通过免费获取更多的语法和训练数据,最终根据这些数据开发的系统能与苹果及Google匹敌。

Wit.ai的一个问题是,所有音频都要通过 互联网 传输到公司的服务器,这意味着使用时会出现延时,甚至隐私问题。不过,Lebrun表现,现在已经有了一个混合版本,能直接在客户端工作。


上一篇:基于Julius的机器人语音识别系统构建
下一篇:安全支付从指间开始 人脸识别尚待改进
精选推荐
这个外科手术机器人可以为患者“量身定制”
这个外科手术机器人可以为患者“量身定制”

[2019-07-12]  世界首创,来自澳大利亚机器人视觉研究中心的研究人员正在推动手术机器人的发展边界,他们创造了可定制的、小型化的手术机器人,能够唯一地 ...

受大脑控制的机器人
受大脑控制的机器人

[2017-03-21]   想让机器人做我们想做的,首先,他得全面地了解我们。通常,这就意味着人类需要要付出更多。比如,教机器人复杂的人类语言或者把一项任务 ...

谷歌在中国成立一个新的人工智能(AI)研究中心
谷歌在中国成立一个新的人工智能(AI)研究中心

[2017-12-13]  谷歌正在中国建立一个新的人工智能(AI)研究中心,希望进一步扩展到中国,以充分利用中国高度重视的人工智能技术。人工智能是目前地球上最具竞争力的领域之一,亚马逊,微软......

美国Natilus公司试飞水上无人货机 设计简单成本降低
美国Natilus公司试飞水上无人货机 设计简单成本降低

[2017-12-28]  Natilus创业公司成立于2014年,其梦想是建造大型无人机,以半价提供比船舶快得多国际货运。在十二月份,Natilus计划在旧金山湾测试一个9米翼展的小型原型无人机的水上滑行能力......

集群机器人领域最新研究:一种用于探测未知环境的微型无人机群
集群机器人领域最新研究:一种用于探测未知环境的微型无人机群

[2019-10-26]  (图:无人机扩散至不同方向来探索环境。当一个无人机注意到另一个无人机在它的首选方向,它将试图飞到另一个方向。若首选方向冲突,低优先 ...

机器人灵巧手将成为智能机器人的下一个重大突破
机器人灵巧手将成为智能机器人的下一个重大突破

[2018-01-25]  计算机科学教授兼东北地区助手机器人实验室负责人罗伯特·普拉特(Robert Platt)说:“机器人手操作是下一步要解决的问题。想象一下,一个机器人可以在现实世界中用手去做事......

17世纪的莱布尼茨试图制造“思想机器”却被现实打脸
17世纪的莱布尼茨试图制造“思想机器”却被现实打脸

[2019-11-05]  莱布尼茨,德国哲学家、数学家、律师,历史上少见的通才1666年,德国博学家戈特弗里德·威廉·莱布尼茨(Gottfried Wilhelm Leibniz)发 ...

2017年:AI渗入云端
2017年:AI渗入云端

[2017-12-29]  云中的人工智能不仅仅是科技巨头的权力游戏,它也可能是人工智能领域的下一个飞跃。加利福尼亚州的Rigetti Computing公司刚刚使用其原型量子芯片之一在其云平台上运行机器学......

本周栏目热点

生物识别技术那么多,为啥偏偏“刷脸”火了

[1970-01-01]   你走到一家自助银行前,摄像头通过刷脸,自动识别你的身份为你开门;你站到ATM机前输入密码,再在摄像 ...

从原理入手,解析基于DSP的汉字语音识别系统的实现方式

[1970-01-01]   语音识别是机器通过识别和理解过程把语音信号转变为相应的文本文件或命令的高技术。作为专门的研究领域 ...

新剪刀手识别技术 虽然现在还不是很准确-模式识别

[2016-03-11]   在几年前的时候,指纹识别看上去还是一项非常高端的技术。的确,这可以让我们在工作和生活当中的很多事 ...

谷歌为何力推虹膜技术 分析其背后的价值链条-模式识别

[2015-12-11]   指纹识别、人脸识别技术正在趋于成熟,也正在被应用到更丰富的场景,逐渐改变我们生活的方方面面。但在 ...

宝马联合三星与松下 研发智能语音识别系统

[2015-12-28]   据美国媒体Autoevolution12月22日报道,宝马、三星和松下三家公司近日与语音识别公司Nuance合作开发新 ...