“软硬齐上”！Nvidia新模型加硬件有望大幅压缩交互延迟

2019-08-20 智东西浏览量：

智东西（公众号：zhidxcom）
编 | 年年

据外媒报道，Nvidia上周宣布，它已经训练出了世界上最大的语言模型MegatronLM，Nvidia还宣布其打破了BERT模型的最快训练记录，在53分钟内成功训练了BERT，并将BERT推理时间降至了2.2毫秒。

BERT推理时间降至了2.2毫秒什么概念呢？目前许多实时应用设置的处理阈值都是10毫秒，2.2毫秒基本就意味着实时反映、实时交互。

这项研究成果将提高自然语言处理的能力和水平，在开源给开发人员后，结合Nvidia自身GPU等强大的硬件将大幅度提高语义理解准确率和交互速度，这对于实现人工智能实时对话将有很大的推动作用。

一、53分钟训练BERT

在打破了所有与计算机视觉模型训练相关的记录后，Nvidia现在宣称其人工智能平台能够在53分钟内训练基于最大数据集之一的自然语言神经网络模型BERT。它还表示BERT的推理时间仅为2.2毫秒，这意味着参与用户对话的模型的响应速度极快。

▲Siri、Alexa、Cortana、Google Assistant

在计算机视觉之后，自然语言处理是人工智能最重要的应用之一。从Siri到Alexa，从Cortana到Google Assistant，所有会话式用户体验工具都由人工智能提供支持。

人工智能研究的新进步将语义理解和语音交互赋能给了开发人员，数据科学家和开发人员现在可以构建定制的人工智能模型，其工作原理与Alexa和Siri完全相同。

不同的是现在可以从医疗保健、法律等垂直行业角度进行专业化的高度定制，这使医生和律师能够与理解术语和对话上下文的AI代理进行交互，这种新的用户体验将成为未来行业应用的一部分。

尽管聊天机器人和会话代理AI已经存在一段时间，但它们还并没有真正接近人类的理解水平，随着人工智能软硬件平台的进步，这种状况将发生变化。

二、NLP研究的改变者“BERT”

去年，谷歌开源了一种新技术，用于预训练自然语言处理（NLP）模型，称为BERT。谷歌的这一技术通过授权开发人员培训他们自己最先进的问答系统和其他基于自然语言的模型，彻底改变了会话领域用户体验。

谷歌展示了BERT如何从斯坦福问答数据集（SQUAD）中产生准确的结果，这是一个阅读理解数据集，基于群众工作者在一组维基百科文章中提出的问题。

由于其激进的方法，BERT是NLP研究界的改变者。与通过从左到右或从右到左阅读句子来推导上下文的其他模型不同，BERT可以一次读取整个句子以获得最准确的上下文，这种方法大大减少了生成高度语境化词汇表示所花费的时间。

▲BioBERT专为生物医学文本挖掘任务而设计

BERT是一些最佳的会话体验的基础，包括BioBERT，一种生物医学领域的语言表示模型，专为生物医学文本挖掘任务而设计。Microsoft增强了BERT以创建多任务深度神经网络（MT-DNN）。MT-DNN根据通用语言理解评估（GLUE）基准，成功为9个NLP任务中的7个设置了新的高性能标准。

三、新模型运行1472个NVIDIA V100 GPU

根据NVIDIA的说法，它的AI平台是第一个能够在不到一个小时的时间内训练BERT并在2毫秒内完成AI推理的平台。

这种突破性的性能水平使开发人员能够将最先进的语言理解用于他们可以向全球数亿消费者提供的大规模应用程序。

▲微软的Azure和Bing

微软已经采用了Nvidia的平台来提供一些基于语言的人工智能服务，为Azure和Bing提供支持。

NVIDIA训练了世界上最大的基于Transformers的语言模型，这个模型拥有83亿个参数，是BERT-Large数据集的24倍。

训练使用了92个共运行1472个NVIDIA V100 GPU的NVIDIA DGX-2H系统，最后在NVIDIA DGX SuperPOD上的训练时间从几天减少到仅53分钟。

除此之外，基于运行TensorRT的NVIDIA T4 GPU的推理时间仅需2.2毫秒，考虑到为许多实时应用设置的10毫秒处理阈值，这是非常快的。

许多加入NVIDIA Inception计划的初创公司都在使用其AI平台和BERT模型的优化版本，为其客户提供下一代用户体验。

结语：软硬件结合实现实时对话

Nvidia的新模型MegatronLM拥有83亿个参数，这对于自然语言处理方面是巨大的进步，在和自身的硬件结合之后，将大大提高语义理解准确率和语音交互速度。

这一进步最重大的意义是有望推动实时对话的实现，目前的AI对话在实现较高准确率的同时都存在一定时间的延迟，而这就很影响用户体验，如果能够缩短甚至基本消除延迟时间，那么语音交互将得到巨大的发展。

精选推荐

研究人员融合人类与AI的创造力显著提高了深度学习的表现

[2019-10-12] 由加拿大人工智能领域研究主席、滑铁卢大学系统设计工程教授Alexander Wong领导的一个团队开发了一种新型紧凑型神经网络家族，可以在智能 ...

比利时研发出可以自我愈合伤口的软体机器人

[2017-09-03] 软体机器人是机器人技术的新兴领域; 他们“可以与人类相互作用，而不会杀死他们，并拿起像西红柿这样柔软的物体。” 从长远来看，布鲁塞尔大学队伍正在努力创建一个类似的材......

2018年企业数字化转型的五大趋势

[2017-12-16] 据2016年哈佛商学院研究表明，选择进行数字化转型的企业在3年内表现出了55%的平均毛利润提升，相比之下其他企业毛利润同期降低了37%。数字化转型企业的领头羊，也曾是收入处于......

哈佛大学《自然》发表新驱动技术，让飞行机器人悬停且不受损伤

[2019-11-06] 哈佛大学研究人员发表在《自然》杂志上的一项最新研究，他们开发了一种由柔软的人造肌肉驱动的机器人蜜蜂（RoboBee），这种机器人在撞墙、 ...

MIT用深度学习处理3D点云数据应用于无人汽车等领域

[2019-10-23] 如果你见过自动驾驶汽车，也许会对车顶上那个一直在旋转的圆柱体感到好奇。这是一个雷达传感器，无人驾驶汽车依靠它在现实世界中进行导航。 ...

基于生物启发的机器人很容易适应丢失附属器官

[2017-12-17] 很多机器人被设计应用在危险环境，如灾难现场。在这些地方，他们的运动系统完全有可能被损坏。那这样会吓跑这些机器人吗？也许不是，如果它们像日本的东北和北海道大学创造的......

一个让深度学习惨败的通用人工智能领域——语境处理

[2019-11-04] Context是指用来解释一段给定文本或语句的来源框架，我们可以翻译为上下文或语境。维基百科将context定义为：*在符号学、语言学、社会学和 ...

2017年：AI渗入云端

[2017-12-29] 云中的人工智能不仅仅是科技巨头的权力游戏，它也可能是人工智能领域的下一个飞跃。加利福尼亚州的Rigetti Computing公司刚刚使用其原型量子芯片之一在其云平台上运行机器学......

本站内容除了特别注明本站原创以外均来自互联网，文章观点不代表本站立场，文章版权归属原作者；如涉及版权问题，请联系smf101@163.com，我们会立即处理。谢谢配合！

本周栏目热点

读心术成现实！麻省理工研发出头戴设备“AlterEgo” 信息识别准确率达92%

[2018-04-09] 据外媒报道，近日，美国麻省理工大学（MIT）新开发了一款名为AlterEgo的头戴设备，可以实现不言自明的读心境界。用户不用说话，它就能够识 ...

苹果设计师曝光VR：设计简约科技感十足

[2016-03-02] 【TechWeb报道】2月28日消息，关于苹果进入VR领域的消息由来以久，最近苹果概念设计师Martin Hajek独 ...

现代机械外骨骼能让普通人举起数百公斤物品

[2016-05-17] 韩国汽车厂商现代最近发布了一副全新的机械外骨骼。在博客文章当中，现代把这个可穿戴机器人原型机与钢铁侠盔甲进行了对比，称其能 ...

智能手环Feel：追踪情绪变化帮助调整情绪

[2016-01-19] 将来回想起来，人们可能隐约会记起那是2016年的某一天：一款名为Feel Bracelet的设备出现了，戴上它人 ...

乐视推VR头盔COOL1：售149元

[2015-12-27] 12月23日消息，乐视今日在京公布其VR（虚拟现实）战略，并发布旗下VR头盔LeVR COOL1。据了解，该款头 ...