爱吧机器人网 » 技术 > 模式识别 > 正文

揭秘语音识别背后的技术,GPU集群+DNN算法

2014年9月26日,浪潮在北京召开2014高性能计算用户大会。从天河一A问鼎世界冠军,到天河2号连续三次位列TPO500的第一名。这几年一路走来,可以看到高性能计算在中国的发展势不可挡,除了在科研领域之外,高性能计算正展现出强大的延展性,与金融、 互联网 、工业设计、文化创意等各行各业之间的交叉关联变得前所未有的紧密。同时,高性能计算与 云计算 、 大数据 之间的交叉融合趋势越发明显,成为推动全球信息产业发展的三大动力之一。

目前智能和连接成为了 互联网 发展的核心词语,语音控制也逐渐火热。目前,Facebook、Google、IBM、苹果、微软、百度、科大讯飞等均在此方面做了多种尝试。

智能语音目前主要依靠深度学习的技术实现,作为 机器学习 的一个重要分支,深度学习在于建立、模拟人脑进行分析学习的 神经网络 ,使得机器能从大量历史数据中学习规律,从而对新的样本做智能识别或对未来做预测,以达到具有人类一样的思考能力。

在本届HPC大会上CSDN采访了科大讯飞高级副总裁胡郁与浪潮Inspur-Intel中国并行计算联合实验室首席工程师张清,和他们深入探讨了如何通过深度学习模拟人类大脑以及如何通过GPU集群来进行 算法 效率的提升等问题。

胡郁表示超算是 人工智能 项目中的关键要素。首先,深度学习技术的再度崛起,正在颠覆统计 模式识别 、 机器学习 和 人工智能 领域,相关专家成为“香饽饽”;其次, 大数据 目前已经和深度学习融合,在 语音识别 和图像识别等感知 人工智能 方面发挥了巨大的作用;最后,超算平台是 人工智能 的基础,提供海量数据处理、存储以及高性能运算解决方案。

科大讯飞是一家专业从事智能语音及语音技术研究、软件及芯片产品开发、语音信息服务的国家级骨干软件企业,他们的语音技术实现了人机语音交互,使人与机器之间沟通变得像人与人沟通一样简单。他们认为语音作为交互的手段,距离能够实现人与人之间的交流的自然鱼眼效果,还有很多多问题没有解决,比如噪音、口音、个性化等等,这还有很打的市场空间,这远不是一些简单的模型与海量数据就能够解决的。那么在科大讯飞 语音识别 背后隐藏着哪些故事呢?我们慢慢来看!

要深入了解一个深度学习计算平台,必须从它的 算法 和架构谈起。深度学习技术有很多支撑的计算机 算法 ,而目前最常用的是DNN 算法 ,它能比较好地模拟人脑神经元多层深度传递的过程,解决智能语音中的复杂问题。然而,要模拟人脑绝非易事,人脑的计算能耗比是世界上最快的超级计算机天河2号的200万倍,众所周知,人类大脑大致有1000亿神经元,每个神经元有大约5000个神经突触。要使机器无限接近人类的思考能力意味着要模拟出更多的神经元和神经突触,这就会带来巨大的计算挑战。

此时的科大讯飞面临着数千倍训练数据及数千倍模型参数的巨大挑战,迫切的需求更大规模、更多存储的超算平台集群建设;更优的深度学习并行化及集群调度 算法 ;深度定制的人工 神经网络 专属芯片系统。

面对这些问题,该如何解决呢?首先是 算法 上优化,科大讯飞将整个DNN环节进行优化压缩,取缔了MFCC、HLDA、VTLN、FMPE等环节,只保留Filter Bank、FFT、Wave、Seq.Train、FMPE等流程,整个架构循环由优化了40%,大幅度的增加了运算速度与效率。

在 算法 调整完以后面临的就是基础设施的建设,如何设计一套占地面积孝计算性能高、又绿色节能的高性能计算集群成为科大讯飞面临的问题。此时浪潮针对这一问题,利用GPU加速技术为该公司设计构建了一套GPU集群,双方联合设计了针对DNN 算法 特点的GPU集群并行计算框架,采用了每个计算节点配置双路CPU和4块NVIDIA Tesla K20m GPU,以及一块HCA卡的方案,通过GPU提高计算能力、通过IB网络提速节点之间的通信速度,最终完成GPU集群版的DNN并行 算法 ,大幅减低了DNN的计算时间。

特别在软件方面,浪潮与科大讯飞户 算法 专家团队共同成立专门联合项目组,节点内使用CPU+GPU协同计算,大幅降低了计算时间。

双方联合针对GPU架构进行了 算法 层面的优化,重写了计算部分代码,将整体速度大幅提升。经过优化后的软件,在单GPU上运行的速度与串行程序相比,加速比达到41倍,1块GPU相当于4.4个8核CPU并行的性能,同时由于浪潮GPU版本K-means具有很好的性能可扩展性,这使得GPU服务器具有很好的性价比非常适合于此类应用大规模部署。

目前科大讯飞的整个基础架构分为:业务、调度、计算、存储四个层次,内含2000颗CPU、300片GPU、4PB的存储、40TB的内存。

在介绍架构建设过程的时候,张清说道:“浪潮已经分别与英特尔和英伟达成立联合并行计算实验室,合作开发优化基于MIC和GPU的并行应用。目前已经建立了一套非常完善的高性能计算集群解决方案,将不仅为用户提供好用的高性能计算集群,还会针对每一个用户的应用特点量身定制集群解决方案,这也就说明未来浪潮将跟用户在应用测试、集群搭建、加速优化等各方面展开合作,把用户的需求看作是浪潮设计构建集群的根本要求。”

解决了 算法 和平台的问题,科大讯飞成功将语音的识别的正确率提升到95%。谈及以后的发展,胡郁表示目前他们正在做“讯飞超脑”计划,他认为 人工智能 分为三个阶段:计算智能,能存会算;感知智能,能听会说、能看会议;认知智能,能思考会理解。他表示 人工智能 目前面临的问题主要有三点:

  • 第一点就是如何让人工 神经网络 能够像人的大脑 神经网络 链接一样,人脑神经元的连接还是比较复杂的;

上一页12下一页

上一篇:语音识别情绪公司Beyond Verbal再获330万美元投资
下一篇:Intel语音识别,摆脱在线宿命
精选推荐
MIT用深度学习处理3D点云数据 应用于无人汽车等领域
MIT用深度学习处理3D点云数据 应用于无人汽车等领域

[2019-10-23]  如果你见过自动驾驶汽车,也许会对车顶上那个一直在旋转的圆柱体感到好奇。这是一个雷达传感器,无人驾驶汽车依靠它在现实世界中进行导航。 ...

机器人iCub作为嵌入式AI的标准机器人研究平台的重要性
机器人iCub作为嵌入式AI的标准机器人研究平台的重要性

[2017-12-24]  机器人的研究在过去10年中得益于一个具有嵌入式人工智能(AI)的标准化开源平台——人形机器人iCub。iCub最初在意大利被创建,如今在欧洲、美国、韩国、新加坡和日本的实验室......

亚马逊计划建一个4000万美元的机器人中心
亚马逊计划建一个4000万美元的机器人中心

[2019-11-07]  爱吧机器人网消息,亚马逊11月6日宣布了一项计划,计划在美国马萨诸塞州韦斯特伯勒建立一个4000万美元、35万平方英尺的机器人创新中心。新 ...

一个让深度学习惨败的通用人工智能领域——语境处理
一个让深度学习惨败的通用人工智能领域——语境处理

[2019-11-04]  Context是指用来解释一段给定文本或语句的来源框架,我们可以翻译为上下文或语境。维基百科将context定义为:*在符号学、语言学、社会学和 ...

麻省理工正研究植物机器人 让植物自主控制机器人
麻省理工正研究植物机器人 让植物自主控制机器人

[2018-12-08]  控制论通常指人类用机器人部件增强自己。我们听说过动物机器人或昆虫机器人,但我们很少听说植物机器人对吧?一个机器人其实是对植物有很大益处的,因为一般植物根本无法移动......

人工智能准确预测患者一年内的死亡风险,原理却无法解释
人工智能准确预测患者一年内的死亡风险,原理却无法解释

[2019-11-13]  图片来自BURGER PHANIE SCIENCE PHOTO LIBRARY美国最新研究显示,人工智能通过查看心脏测试结果,以高达85%以上的准确率预测了一个人在一 ...

美国Natilus公司试飞水上无人货机 设计简单成本降低
美国Natilus公司试飞水上无人货机 设计简单成本降低

[2017-12-28]  Natilus创业公司成立于2014年,其梦想是建造大型无人机,以半价提供比船舶快得多国际货运。在十二月份,Natilus计划在旧金山湾测试一个9米翼展的小型原型无人机的水上滑行能力......

CES 2018:英特尔推出49量子位芯片争夺量子霸权
CES 2018:英特尔推出49量子位芯片争夺量子霸权

[2018-01-10]  在与Google、IBM的一场关于建立量子计算系统的马拉松比赛中,英特尔通过了一个关键的里程碑。近日,这个科技巨头已经推出了一个49个量子位 ...

本周栏目热点

生物识别技术那么多,为啥偏偏“刷脸”火了

[1970-01-01]   你走到一家自助银行前,摄像头通过刷脸,自动识别你的身份为你开门;你站到ATM机前输入密码,再在摄像 ...

从原理入手,解析基于DSP的汉字语音识别系统的实现方式

[1970-01-01]   语音识别是机器通过识别和理解过程把语音信号转变为相应的文本文件或命令的高技术。作为专门的研究领域 ...

新剪刀手识别技术 虽然现在还不是很准确-模式识别

[2016-03-11]   在几年前的时候,指纹识别看上去还是一项非常高端的技术。的确,这可以让我们在工作和生活当中的很多事 ...

谷歌为何力推虹膜技术 分析其背后的价值链条-模式识别

[2015-12-11]   指纹识别、人脸识别技术正在趋于成熟,也正在被应用到更丰富的场景,逐渐改变我们生活的方方面面。但在 ...

宝马联合三星与松下 研发智能语音识别系统

[2015-12-28]   据美国媒体Autoevolution12月22日报道,宝马、三星和松下三家公司近日与语音识别公司Nuance合作开发新 ...