爱吧机器人网 » 技术 > 机器学习 > 正文

Graphcore 研发出AI芯片让机器学习提速百倍

作为英国最热门的创业公司之一,Graphcore专注于加速复杂机器学习模型的训练以及推断过程。他们正在开发人工智能芯片,以降低企业数据中心和云端使用AI应用程序的成本,并将性能提高达到目前最快的系统的100倍。

\
 
该公司计划在2018年初将其第一代AI芯片交付给第一家客户。但是,由于许多互联网服务都是在云端进行处理,因此仍要一段时间才能在智能手机等设备上安装芯片。
 
包括Facebook和Google在内的许多互联网公司都在努力使自己的视频广告与人们观看的内容更有相关性。他们的算法无法捕捉到每个视频上每一帧的图片,以帮助它更有效地锁定人们关注点。这将是一个非常复杂的过程,涉及大规模地实时计算大量数据。
 
这只是人工智能众多突破中的一个例子。为了让视频广告更有效地锁定用户,我们需要更强大的芯片来处理每天上传的所有视觉信息。Graphcore正在开发顶尖的处理器,为下一代AI软件提供支持,以更好地了解用户,并在YouTube等大视频平台上为广告定位软件提供支持
 
智能处理单元
 
Graphcore  开发了一种专用于机器智能工作负载的新处理器,并将其命名为智能处理单元(IPU)。它已被调整为能够高效地处理机器智能工作负载所需的大型复杂高维模型。该系统具有超过14,000个独立的处理器线程,并强调并行,低精度点计算,并提供比其他解决方案更高的计算密度。

\
 
智能计算如何工作 
 
1.     学习 - 将数据放入高维知识模型中
 
2.     判断 - 总结知识模型的数据
 
3.     预测 - 通过知识模型给出一些输入来推导合适的输出
 
4.     推理 - 通过知识模型给出一些输出来推导合适的输入
 
它们都适用于一台计算机的优化过程。知识模型通常以图形表示,其中顶点是特征,边缘是相关性。
 
“白杨”(Poplar)
 
Graphcore使用名为“白杨”(Poplar)的C ++框架来处理IPU加速平台。它旨在为流行的机器学习框架(包括MXNet和Tensorflow)提供无缝接口,因此IPU与现有的应用程序相兼容。
 
“白杨”图形框架由一整套驱动程序、应用程序库、用于优化性能的分析/调试工具以及用于开发应用程序的Python和C ++接口组成。
 
“白杨”包装了一个从头开发的图编译器,可以将机器学习框架使用的标准操作转换为IPU的优化应用程序代码。它创建了一个图表的中介码,以便在多个IPU上部署。而且,编译器是能够显示这个图形的,所以在机器学习框架上编写的代码会显示成在IPU上运行的图形的图像。
 
编译器已经将网络描述转换成约1870万个顶点和11580万个边缘的计算图,这代表了一个名为AlexNet的强大的深度神经网络,作为IPU的执行计划。顶点与进程计算相关联,边源代表进程之间的通信。

\
 
IPU等图形处理器专为创建和执行各种深度学习模型的计算图网络而设计。我们都知道机器学习是计算的未来,而Graphcore则承诺类似IPU的架构将进行下一波计算。
 
基准
 
批量大小决定数据项规模,需要在训练机器学习模型的同时与当前的一组参数并行处理。如图所示,IPU在根据在训练ResNet 50神经网络上时每秒图像的性能估计,以学习ImageNet数据集的图像分类。

\
 
该图表显示即使在批量较小的情况下也能显着提高性能。当IPU加速卡扩展到8的时候,使用批量大小为64。在任何情况下,使用IPU系统都会比现有技术显着提高性能。例如,在300瓦GPU加速器上获得的最佳性能是每秒580张左右。
 
长短期记忆模型(LSTM)推断
 
时间递归神经网络中的数据依赖性限制了并行能力以及每个数据的操作数量。IPU和”白杨”的库照顾这些限制。该图显示了与GPU相比不同延迟约束的单层LSTM网络性能。

\
 
生成式网络
 
下图显示了DeepVoice  生成算法与其他平台相比的性能  。实验考虑了两种性能指标。如果可以生成实时数据流,样本生成速度决定了一次生成多少个音频通道。

\\
 
资金
 
近一年来,该公司已经筹集了3轮资金,约1.1亿美元。最近,2017年11月12日,Graphcore与红杉资本(Sequoia Capital)结束了5000万美元的C轮融资,这家并不知名的公司在欧洲进行大规模投资。这是Graphcore在之前的融资中已经筹集的6000万美元。
 
他们的其他投资者包括 Samsung, Bosch, Atomico, Dell Technologies Capital, DraperEsprit, Amadeus Capital, Foundation Capital 和 4 Ventures。首席执行官Nigel Toon表示,他们将利用这笔资金扩大生产规模,吸引更多的开发者加入平台,并花时间向潜在客户了解他们的产品是否解决了真正的问题。
 
竞争对手
 
毫无疑问,英伟达和英特尔正在这个市场上提出强烈的要求,同时他们利用数十年的经验和巨大的资金投入研发和市场营销。事实上,他们已经变成了几乎所有硬件的庞大提供商,从游戏和机器学习到加密货币挖矿机。
 
苹果在A11仿生芯片中有自己的硬件,谷歌有张量处理器能与TensorFlow很好地搭配。然后有报道 说,特斯拉可能会与AMD合作,为自驾车开发自己的AI芯片。他们都是巨头,但是考虑到市场机会,像Graphcore这样的AI创业公司似乎已成长到可以追赶这些巨头。
 
-END-


上一篇:传统编程遇上机器学习会擦出怎样的火花
下一篇:主流机器学习算法简介与其优缺点分析
精选推荐
亚马逊CEO杰夫·贝佐斯操控巨型有人驾驶机器人(巨型机甲)
亚马逊CEO杰夫·贝佐斯操控巨型有人驾驶机器人(巨型机甲)

[2017-03-21]  近日,亚马逊CEO杰夫·贝佐斯实现了每一个6岁儿童都会有的梦想,他控制了一个巨大的机甲机器人。据国外媒体Verge报道,前天(3月19日),贝 ...

麻省理工正研究植物机器人 让植物自主控制机器人
麻省理工正研究植物机器人 让植物自主控制机器人

[2018-12-08]  控制论通常指人类用机器人部件增强自己。我们听说过动物机器人或昆虫机器人,但我们很少听说植物机器人对吧?一个机器人其实是对植物有很大益处的,因为一般植物根本无法移动......

深度神经网络揭示了大脑喜欢看什么
深度神经网络揭示了大脑喜欢看什么

[2019-11-06]  爱吧机器人网编者按:近日,《自然-神经科学》发表了一篇论文,研究人员创建了一种深度人工神经网络,能够准确预测生物大脑对视觉刺激所产 ...

MIT研制出可以像植物一样生长的机器人
MIT研制出可以像植物一样生长的机器人

[2019-11-09]  麻省理工学院开发了一种新型机器人,这种机器人可以本质上自我延伸,其生长方式与植物幼苗向上生长的方式惊人相似。值得注意的是,研究人员 ...

7种常见的机器人焊接类型
7种常见的机器人焊接类型

[2017-12-17]  机器人焊接是工业领域最常见的机器人应用之一,近几十年来主要由汽车行业驱动。机器人焊接在完成大批量,重复性的焊接任务时效率最高。...

人工智能民主化能否实现取决于科技巨头
人工智能民主化能否实现取决于科技巨头

[2017-12-29]  我们经常听到像谷歌和微软这样的公司说他们希望人工智能民主化。这是一个很好的词,民主化。 但这些公司如何界定“民主化”还不清楚,像AI本身一样,它似乎有点炒作的味道...

受大脑控制的机器人
受大脑控制的机器人

[2017-03-21]   想让机器人做我们想做的,首先,他得全面地了解我们。通常,这就意味着人类需要要付出更多。比如,教机器人复杂的人类语言或者把一项任务 ...

麻省理工最新机器人“装配工”未来可建造太空基地
麻省理工最新机器人“装配工”未来可建造太空基地

[2019-10-17]  两个机器人原型把一系列小单元组装成大结构体麻省理工学院科研人员最近提出一种新型机器人技术,即一种小型机器人系统,能够自主地用统一规 ...

本周栏目热点

盘点全球十大最具影响力的机器人摇篮

[1970-01-01]    人工智能(AI)研究现正迅速发展,如无人驾驶汽车、计算机在《危险边缘》智力竞赛节目中获胜、数字私人助手Siri、GoogleNow和语音助手C ...

深度学习反向传播算法(BP)原理推导及代码实现

[2017-12-19]  分析了手写字数据集分类的原理,利用神经网络模型,编写了SGD算法的代码,分多个epochs,每个 epoch 又对 mini_batch 样本做多次迭代计算。这其中,非常重要的一个步骤,......

如何在机器学习项目中使用统计方法的示例

[2018-07-23]  事实上,机器学习预测建模项目必须通过统计学方法才能有效的进行。在本文中,我们将通过实例介绍一些在预测建模问题中起关键作用的统计学方法。...

[2017-08-28]  模拟退火(Simulated Annealing,简称SA)是一种通用概率算法,用来在一个大的搜寻空间内找寻命题的最优解。1、固体退火原理:将固体加温 ...

Machine Learning-感知器分类算法详解

[2018-05-31]  今天我们来讲解的内容是感知器分类算法,本文的结构如下:什么是感知器分类算法,在Python中实现感知器学习算法,在iris(鸢尾花)数据集上训练一个感知器模型,自适应线性神......