爱吧机器人网 » 技术 > 机器学习 > 正文

Graphcore 研发出AI芯片让机器学习提速百倍

作为英国最热门的创业公司之一,Graphcore专注于加速复杂机器学习模型的训练以及推断过程。他们正在开发人工智能芯片,以降低企业数据中心和云端使用AI应用程序的成本,并将性能提高达到目前最快的系统的100倍。

\
 
该公司计划在2018年初将其第一代AI芯片交付给第一家客户。但是,由于许多互联网服务都是在云端进行处理,因此仍要一段时间才能在智能手机等设备上安装芯片。
 
包括Facebook和Google在内的许多互联网公司都在努力使自己的视频广告与人们观看的内容更有相关性。他们的算法无法捕捉到每个视频上每一帧的图片,以帮助它更有效地锁定人们关注点。这将是一个非常复杂的过程,涉及大规模地实时计算大量数据。
 
这只是人工智能众多突破中的一个例子。为了让视频广告更有效地锁定用户,我们需要更强大的芯片来处理每天上传的所有视觉信息。Graphcore正在开发顶尖的处理器,为下一代AI软件提供支持,以更好地了解用户,并在YouTube等大视频平台上为广告定位软件提供支持
 
智能处理单元
 
Graphcore  开发了一种专用于机器智能工作负载的新处理器,并将其命名为智能处理单元(IPU)。它已被调整为能够高效地处理机器智能工作负载所需的大型复杂高维模型。该系统具有超过14,000个独立的处理器线程,并强调并行,低精度点计算,并提供比其他解决方案更高的计算密度。

\
 
智能计算如何工作 
 
1.     学习 - 将数据放入高维知识模型中
 
2.     判断 - 总结知识模型的数据
 
3.     预测 - 通过知识模型给出一些输入来推导合适的输出
 
4.     推理 - 通过知识模型给出一些输出来推导合适的输入
 
它们都适用于一台计算机的优化过程。知识模型通常以图形表示,其中顶点是特征,边缘是相关性。
 
“白杨”(Poplar)
 
Graphcore使用名为“白杨”(Poplar)的C ++框架来处理IPU加速平台。它旨在为流行的机器学习框架(包括MXNet和Tensorflow)提供无缝接口,因此IPU与现有的应用程序相兼容。
 
“白杨”图形框架由一整套驱动程序、应用程序库、用于优化性能的分析/调试工具以及用于开发应用程序的Python和C ++接口组成。
 
“白杨”包装了一个从头开发的图编译器,可以将机器学习框架使用的标准操作转换为IPU的优化应用程序代码。它创建了一个图表的中介码,以便在多个IPU上部署。而且,编译器是能够显示这个图形的,所以在机器学习框架上编写的代码会显示成在IPU上运行的图形的图像。
 
编译器已经将网络描述转换成约1870万个顶点和11580万个边缘的计算图,这代表了一个名为AlexNet的强大的深度神经网络,作为IPU的执行计划。顶点与进程计算相关联,边源代表进程之间的通信。

\
 
IPU等图形处理器专为创建和执行各种深度学习模型的计算图网络而设计。我们都知道机器学习是计算的未来,而Graphcore则承诺类似IPU的架构将进行下一波计算。
 
基准
 
批量大小决定数据项规模,需要在训练机器学习模型的同时与当前的一组参数并行处理。如图所示,IPU在根据在训练ResNet 50神经网络上时每秒图像的性能估计,以学习ImageNet数据集的图像分类。

\
 
该图表显示即使在批量较小的情况下也能显着提高性能。当IPU加速卡扩展到8的时候,使用批量大小为64。在任何情况下,使用IPU系统都会比现有技术显着提高性能。例如,在300瓦GPU加速器上获得的最佳性能是每秒580张左右。
 
长短期记忆模型(LSTM)推断
 
时间递归神经网络中的数据依赖性限制了并行能力以及每个数据的操作数量。IPU和”白杨”的库照顾这些限制。该图显示了与GPU相比不同延迟约束的单层LSTM网络性能。

\
 
生成式网络
 
下图显示了DeepVoice  生成算法与其他平台相比的性能  。实验考虑了两种性能指标。如果可以生成实时数据流,样本生成速度决定了一次生成多少个音频通道。

\\
 
资金
 
近一年来,该公司已经筹集了3轮资金,约1.1亿美元。最近,2017年11月12日,Graphcore与红杉资本(Sequoia Capital)结束了5000万美元的C轮融资,这家并不知名的公司在欧洲进行大规模投资。这是Graphcore在之前的融资中已经筹集的6000万美元。
 
他们的其他投资者包括 Samsung, Bosch, Atomico, Dell Technologies Capital, DraperEsprit, Amadeus Capital, Foundation Capital 和 4 Ventures。首席执行官Nigel Toon表示,他们将利用这笔资金扩大生产规模,吸引更多的开发者加入平台,并花时间向潜在客户了解他们的产品是否解决了真正的问题。
 
竞争对手
 
毫无疑问,英伟达和英特尔正在这个市场上提出强烈的要求,同时他们利用数十年的经验和巨大的资金投入研发和市场营销。事实上,他们已经变成了几乎所有硬件的庞大提供商,从游戏和机器学习到加密货币挖矿机。
 
苹果在A11仿生芯片中有自己的硬件,谷歌有张量处理器能与TensorFlow很好地搭配。然后有报道 说,特斯拉可能会与AMD合作,为自驾车开发自己的AI芯片。他们都是巨头,但是考虑到市场机会,像Graphcore这样的AI创业公司似乎已成长到可以追赶这些巨头。
 
-END-


上一篇:传统编程遇上机器学习会擦出怎样的火花
下一篇:主流机器学习算法简介与其优缺点分析
精选推荐
人工智能民主化能否实现取决于科技巨头
人工智能民主化能否实现取决于科技巨头

[2017-12-29]  我们经常听到像谷歌和微软这样的公司说他们希望人工智能民主化。这是一个很好的词,民主化。 但这些公司如何界定“民主化”还不清楚,像AI本身一样,它似乎有点炒作的味道...

通过对抗性图像黑入大脑
通过对抗性图像黑入大脑

[2018-03-02]  在上面的图片中,左边是一张猫的照片。在右边,你能分辨出它是同一只猫的图片,还是一张看起来相似的狗的图片?这两张图片之间的区别在于, ...

如何让人工智能机器人快速自我纠正错误并吃一堑长一智?
如何让人工智能机器人快速自我纠正错误并吃一堑长一智?

[2017-08-23]  莱斯特大学数学系的研究人员在《Neural Networks》杂志上发表了一篇文章,概述了新算法的数学基础,可以使人工智能收集错误报告并立即纠正,而不影响现有技能 ,同时还会积......

科学家从蟑螂获得启发 教机器人更好地走路
科学家从蟑螂获得启发 教机器人更好地走路

[2017-12-11]  Weihmann指出:“我特别感到惊讶的是,动物运动稳定机制的变化与腿部协调的变化是一致的。昆虫的慢运行非常稳定,因为它的重心很低,三条腿总是以协调的方式运动。...

哈佛大学《自然》发表新驱动技术,让飞行机器人悬停且不受损伤
哈佛大学《自然》发表新驱动技术,让飞行机器人悬停且不受损伤

[2019-11-06]  哈佛大学研究人员发表在《自然》杂志上的一项最新研究,他们开发了一种由柔软的人造肌肉驱动的机器人蜜蜂(RoboBee),这种机器人在撞墙、 ...

新型轻便机器人套装重5kg,辅助跑步和步行
新型轻便机器人套装重5kg,辅助跑步和步行

[2019-10-23]  虽然步行对大多数人来说似乎不是负担,但对有些人来说,这项简单的运动往往会让人感到筋疲力尽。比如手术或中风后恢复的患者、帕金森氏症患 ...

受大脑控制的机器人
受大脑控制的机器人

[2017-03-21]   想让机器人做我们想做的,首先,他得全面地了解我们。通常,这就意味着人类需要要付出更多。比如,教机器人复杂的人类语言或者把一项任务 ...

2017年:AI渗入云端
2017年:AI渗入云端

[2017-12-29]  云中的人工智能不仅仅是科技巨头的权力游戏,它也可能是人工智能领域的下一个飞跃。加利福尼亚州的Rigetti Computing公司刚刚使用其原型量子芯片之一在其云平台上运行机器学......

本周栏目热点

盘点全球十大最具影响力的机器人摇篮

[1970-01-01]    人工智能(AI)研究现正迅速发展,如无人驾驶汽车、计算机在《危险边缘》智力竞赛节目中获胜、数字私人助手Siri、GoogleNow和语音助手C ...

深度学习反向传播算法(BP)原理推导及代码实现

[2017-12-19]  分析了手写字数据集分类的原理,利用神经网络模型,编写了SGD算法的代码,分多个epochs,每个 epoch 又对 mini_batch 样本做多次迭代计算。这其中,非常重要的一个步骤,......

如何在机器学习项目中使用统计方法的示例

[2018-07-23]  事实上,机器学习预测建模项目必须通过统计学方法才能有效的进行。在本文中,我们将通过实例介绍一些在预测建模问题中起关键作用的统计学方法。...

[2017-08-28]  模拟退火(Simulated Annealing,简称SA)是一种通用概率算法,用来在一个大的搜寻空间内找寻命题的最优解。1、固体退火原理:将固体加温 ...

Machine Learning-感知器分类算法详解

[2018-05-31]  今天我们来讲解的内容是感知器分类算法,本文的结构如下:什么是感知器分类算法,在Python中实现感知器学习算法,在iris(鸢尾花)数据集上训练一个感知器模型,自适应线性神......