谷歌TPU 3.0到底厉害在哪里？-智能硬件-技术-爱吧机器人网

谷歌TPU 3.0到底厉害在哪里？

2018-05-11 新智元浏览量：

来源：StarryHeavensAbove
作者：唐杉

Google在I/O大会上发布了TPU3，虽然目前详细信息不多，但下面几点还是值得讨论：8倍性能；快速迭代；云服务和Benchmark。TPU3到底哪里厉害？

8倍性能

今天的新闻中我们都可以看到如下描述“Google CEO Sundar Pichai said the new TPU is eight times more powerful than last year per pod, with up to 100 petaflops in performance.”也就是说一个TPU3 pod的总处理能力100 PFLOPS是TPU2 pod的8倍。

从下图我们可以看一下TPU3 pod和TPU2 pod的对比。

TPU2的一个pod包括4个rack，两个CPU rack（左右两边），两个TPU rack（中间两个）。每个rack有32个computing unit (板卡），每个TPU板卡有4颗TPU芯片。因此一个pod总共有64 x 4颗TPU2芯片。每颗TPU2芯片的处理能力是45TFLOPS，因此一个pod总的处理能力是45 x 4 x 64 = 11.5 PFLOPS.

对比来看，TPU3的板卡仍然包括4颗芯片。但目测TPU3 pod的rack数量和板卡的密度（这个看的不是很清楚）和TPU2相比都增加了一倍。因此，一个pod中的TPU3芯片的数量应该是之前4倍。如果pod的总处理能力是TPU2的8倍，那么TPU3单芯片的处理能力则为TPU2的2倍。

根据Google的说法，这次他们第一次在Data center采用水冷的散热方式，这可能和芯片功耗以及板卡密度增加有关系。

总得来说，如上图所描述（来自Google I/O大会的talk：Effective Machine Learning with Google TPU，可以在YouTube上搜索Google io 18 stage 8观看），TPU3实现的超过100 PFLOPS的处理能力是来自“新的芯片架构和大规模系统”。

快速迭代

从去年I/O大会发布TPU2到今天不过一年时间，Google的芯片迭代速度还是非常惊人的。“为什么Google能够实现这样的快速迭代？”这也是一个非常值得探讨的话题。

我先简单谈几点个人看法：

第一，TPU是一个Domain-specific Architecture（参考当我们设计一个专用处理器的时候我们在干什么？（上）），定位准确，架构简单，容易扩展。相比之下，传统的通用处理器必须考虑灵活性和兼容性，有太重的包袱。当然，TPU这种特点也决定它只能用于有限的应用场景，可能只有Google的体量以及云服务能够所提供的应用需求才能充分利用TPU这种专用芯片，这一点是得天独厚的。这也是目前几乎所有科技巨头都开始自研芯片的一个基本考量。而传统的芯片厂商在这一点上就有些尴尬了。

第二，Google的软件和系统能力超强，TPU以Cloud service出现，提高给客户的是整体服务。芯片硬件可做的tradeoff空间比较大，芯片本身的弱点可以在系统层面弥补。从目前得到的信息分析的，TPU3的处理能力是TPU2的8倍，其中芯片换代的贡献只有2倍，大部分改进在系统层面。另一方面，目前芯片开发离不开相关软件工具，Google的软件能力和生态也是其能够实现芯片快速迭代的一个重要因素。

第三，钱很重要。Google不差钱，在芯片实现上可以通过花钱换取时间。

总得来说，Google TPU的意义可能远远超过芯片本身。它背后的芯片设计逻辑，实现方法，应用模式和生态环境，相较传统芯片开发有很大区别，也许会成为趋势。
云服务和Benchmark

Google在发布TPU3的时候同时提到了新的云服务，在之前的Cloud TPU基础上，今年晚些时候还会发布Cloud TPU pod（不知道谁能用的起？），可以看出TPU对于Goolge的云端战略的重要意义。

有意思的是，在Google的talk中强调了cost的问题，每个例子都给出了相应的training cost，画风是这样的。

这里颇有广告的感觉，不禁让人想起黄教主的”The more GPUs you buy, The more money you save“。结合最近Microsoft对Brainwave项目的宣传，感觉云端机器学习的价格战马上就要开始了。

另外，Google也强调了Benchmark的重要性，还专门展示了他们最近力推的MLPerf。

最近不同平台之间的对比很多，有比性能的，也有拼成本的。相信随着越来越多的厂商加入，刷榜应该会非常热闹。

精选推荐

机器人从工业走向家庭库卡KUKA目标是引领中国市场

[2017-12-08] 机器人正在改变着人们的生活方式，而库卡KUKA想要在中国这个大蛋糕中占有一块大份额，库卡公司正在引领市场...

可编辑神经网络，有望简化深度学习？

[2019-10-04] 深度学习是一个计算繁重的过程。降低成本一直是 Data curation 的一大挑战。关于深度学习神经网络大功耗的训练过程，已经有研究人员 ...

德国研发出一种能在你体内工作的微型机器人

[2018-01-26] 纽约时报的报道，德国的研究人员已经开发出一种长约七分之一英寸的机器人，首先看起来不过是一小块橡皮条。然后它开始移动。机器人走路，跳跃，爬行，滚动和游泳。它甚至爬出......

全自动膝关节置换手术机器人被美国FDA批准上市

[2019-10-14] 美国Think Surgical公司已获得美国食品和药物管理局（FDA）的批准，在美国销售用于全膝关节置换（TKA）的TSolution One®全膝关节应用 ...

2018年企业数字化转型的五大趋势

[2017-12-16] 据2016年哈佛商学院研究表明，选择进行数字化转型的企业在3年内表现出了55%的平均毛利润提升，相比之下其他企业毛利润同期降低了37%。数字化转型企业的领头羊，也曾是收入处于......

如何让人工智能机器人快速自我纠正错误并吃一堑长一智？

[2017-08-23] 莱斯特大学数学系的研究人员在《Neural Networks》杂志上发表了一篇文章，概述了新算法的数学基础，可以使人工智能收集错误报告并立即纠正，而不影响现有技能，同时还会积......

2023年服务机器人市场将超过250亿美元

[2017-09-04] 全球服务机器人市场预计到2023年将达到250亿美元, 并在预测期内登记15% 的复合年增长率。短期中期回收期和投资回报率高 (ROI), 以及在教育和研究、临场感、防御、救援和安......

集群机器人领域最新研究：一种用于探测未知环境的微型无人机群

[2019-10-26] （图：无人机扩散至不同方向来探索环境。当一个无人机注意到另一个无人机在它的首选方向，它将试图飞到另一个方向。若首选方向冲突，低优先 ...

本站内容除了特别注明本站原创以外均来自互联网，文章观点不代表本站立场，文章版权归属原作者；如涉及版权问题，请联系smf101@163.com，我们会立即处理。谢谢配合！

本周栏目热点

读心术成现实！麻省理工研发出头戴设备“AlterEgo” 信息识别准确率达92%

[2018-04-09] 据外媒报道，近日，美国麻省理工大学（MIT）新开发了一款名为AlterEgo的头戴设备，可以实现不言自明的读心境界。用户不用说话，它就能够识 ...

苹果设计师曝光VR：设计简约科技感十足

[2016-03-02] 【TechWeb报道】2月28日消息，关于苹果进入VR领域的消息由来以久，最近苹果概念设计师Martin Hajek独 ...

现代机械外骨骼能让普通人举起数百公斤物品

[2016-05-17] 韩国汽车厂商现代最近发布了一副全新的机械外骨骼。在博客文章当中，现代把这个可穿戴机器人原型机与钢铁侠盔甲进行了对比，称其能 ...

智能手环Feel：追踪情绪变化帮助调整情绪

[2016-01-19] 将来回想起来，人们可能隐约会记起那是2016年的某一天：一款名为Feel Bracelet的设备出现了，戴上它人 ...

乐视推VR头盔COOL1：售149元

[2015-12-27] 12月23日消息，乐视今日在京公布其VR（虚拟现实）战略，并发布旗下VR头盔LeVR COOL1。据了解，该款头 ...