作为英国最热门的创业公司之一,Graphcore专注于加速复杂
机器学习模型的训练以及推断过程。他们正在开发人工智能芯片,以降低企业数据中心和云端使用AI
应用程序的成本,并将性能提高达到目前最快的系统的100倍。
该公司计划在2018年初将其第一代AI芯片交付给第一家客户。但是,由于许多互联网服务都是在云端进行处理,因此仍要一段时间才能在智能手机等设备上安装芯片。
包括Facebook和Google在内的许多互联网公司都在努力使自己的视频广告与人们观看的内容更有相关性。他们的算法无法捕捉到每个视频上每一帧的图片,以帮助它更有效地锁定人们关注点。这将是一个非常复杂的过程,涉及大规模地实时计算大量数据。
这只是
人工智能众多突破中的一个例子。为了让视频广告更有效地锁定用户,我们需要更强大的芯片来处理每天上传的所有视觉信息。Graphcore正在开发顶尖的处理器,为下一代AI软件提供支持,以更好地了解用户,并在YouTube等大视频平台上为广告定位软件提供支持
智能处理单元
Graphcore 开发了一种专用于机器智能工作负载的新处理器,并将其命名为智能处理单元(IPU)。它已被调整为能够高效地处理机器智能工作负载所需的大型复杂高维模型。该系统具有超过14,000个独立的处理器线程,并强调并行,低精度点计算,并提供比其他解决方案更高的计算密度。
智能计算如何工作
1. 学习 - 将数据放入高维知识模型中
2. 判断 - 总结知识模型的数据
3. 预测 - 通过知识模型给出一些输入来推导合适的输出
4. 推理 - 通过知识模型给出一些输出来推导合适的输入
它们都适用于一台计算机的优化过程。知识模型通常以图形表示,其中顶点是特征,边缘是相关性。
“白杨”(Poplar)
Graphcore使用名为“白杨”(Poplar)的C ++框架来处理IPU加速平台。它旨在为流行的机器学习框架(包括MXNet和Tensorflow)提供无缝接口,因此IPU与现有的应用程序相兼容。
“白杨”图形框架由一整套驱动程序、应用程序库、用于优化性能的分析/调试工具以及用于开发应用程序的Python和C ++接口组成。
“白杨”包装了一个从头开发的图编译器,可以将机器学习框架使用的标准操作转换为IPU的优化应用程序代码。它创建了一个图表的中介码,以便在多个IPU上部署。而且,编译器是能够显示这个图形的,所以在机器学习框架上编写的代码会显示成在IPU上运行的图形的图像。
编译器已经将网络描述转换成约1870万个顶点和11580万个边缘的计算图,这代表了一个名为AlexNet的强大的深度神经网络,作为IPU的执行计划。顶点与进程计算相关联,边源代表进程之间的通信。
IPU等图形处理器专为创建和执行各种深度学习模型的计算图网络而设计。我们都知道机器学习是计算的未来,而Graphcore则承诺类似IPU的架构将进行下一波计算。
基准
批量大小决定数据项规模,需要在训练机器学习模型的同时与当前的一组参数并行处理。如图所示,IPU在根据在训练ResNet 50神经网络上时每秒图像的性能估计,以学习ImageNet数据集的图像分类。
该图表显示即使在批量较小的情况下也能显着提高性能。当IPU加速卡扩展到8的时候,使用批量大小为64。在任何情况下,使用IPU系统都会比现有技术显着提高性能。例如,在300瓦GPU加速器上获得的最佳性能是每秒580张左右。
长短期记忆模型(LSTM)推断
时间递归神经网络中的数据依赖性限制了并行能力以及每个数据的操作数量。IPU和”白杨”的库照顾这些限制。该图显示了与GPU相比不同延迟约束的单层LSTM网络性能。
生成式网络
下图显示了DeepVoice 生成算法与其他平台相比的性能 。实验考虑了两种性能指标。如果可以生成实时数据流,样本生成速度决定了一次生成多少个音频通道。
资金
近一年来,该公司已经筹集了3轮资金,约1.1亿美元。最近,2017年11月12日,Graphcore与红杉资本(Sequoia Capital)结束了5000万美元的C轮融资,这家并不知名的公司在欧洲进行大规模投资。这是Graphcore在之前的融资中已经筹集的6000万美元。
他们的其他投资者包括 Samsung, Bosch, Atomico, Dell Technologies Capital, DraperEsprit, Amadeus Capital, Foundation Capital 和 4 Ventures。首席执行官Nigel Toon表示,他们将利用这笔资金扩大生产规模,吸引更多的开发者加入平台,并花时间向潜在客户了解他们的产品是否解决了真正的问题。
竞争对手
毫无疑问,英伟达和英特尔正在这个市场上提出强烈的要求,同时他们利用数十年的经验和巨大的资金投入研发和市场营销。事实上,他们已经变成了几乎所有硬件的庞大提供商,从游戏和机器学习到加密货币挖矿机。
苹果在A11仿生芯片中有自己的硬件,谷歌有张量处理器能与TensorFlow很好地搭配。然后有报道 说,特斯拉可能会与AMD合作,为自驾车开发自己的AI芯片。他们都是巨头,但是考虑到市场机会,像Graphcore这样的AI创业公司似乎已成长到可以追赶这些巨头。
-END-