谷歌神经翻译又有新进展基于单一模型无须训练-神经网络-技术-爱吧机器人网

谷歌神经翻译又有新进展基于单一模型无须训练

2016-11-20 互联网浏览量：

大家都知道，欧盟拥有24种官方语言，理想情况下，欧盟的翻译官们应该能够随时从一种语言直译到另一种语言，但这种翻译组合实在是太多了，高达576种，所以他们选择英语当做中间语言来解决这一问题。

同样地，我们的谷歌工程师们也面临着同样的问题，但谷歌面临的麻烦要更大一点，因为他们需要翻译的语言种类要比欧盟的官方语言多，达到100多种，（例如：英语翻法语是一种组合，而法语翻英语又是另一种组合），而这些翻译组合会高达上万种。

如果为每一种组合训练一种神经翻译模型的话，那么就需要训练上万个。真的是好多啊！但是现在不要了，我们只需要一个模型就可以解决这些问题。近日，来自谷歌的工程师门发表了一篇论文，上面提到如何只用一个模型实现多语言之间的翻译。这个模型被称为NMT模型。 NMT模型的训练不需要任何语言学知识，且具有模型简单、翻译质量高等优点。它基于原有的单一语言翻译模型，但不需要对原有翻译模型进行任何修改，便可实现多语言之间的翻译。

论文显示这种新方法有三个优点：

一、简单，即减少需要训练的模型数；

二、改善翻译质量。尤其是那些训练语料不足的语言；

三、具有‘zero shot’翻译能力，即如果我们训练一个模型可以将葡萄牙语翻译成英语，然后在训练一下让其可以实现英语到西班牙语之间的翻译，此时神奇的一幕出现了，我们虽然并没有进行葡萄牙语到西班牙语之间的翻译，但是此时模型仍然可以实现葡萄牙语到西班牙语之间的正确翻译。

谷歌宣称这是世界首次研发出zero-shot翻译。很明显，zero-shot 还具有明显的速度优势，它可以使解码时间减半。其另一个优势就是可以实现句间转换。如果一个句子中包含不止一种语言，它照样可以翻译。这样如果一个大的数据集中如果包含多种语言，那么它照样可以实现翻译。论文的最后，谷歌翻译人员用BLEU方法对翻译结果进行评判，发现结果改善不少。

实际上，神经机器翻译还有很长的路要走。谷歌貌似已经将NMT 推广到了其它语言翻译上，例如英语到德语的翻译。在我们对谷歌翻译进行的随机测试中，我们发现其翻译流畅度有所提升，但仍有一些漏翻或误翻。

精选推荐

哈佛大学《自然》发表新驱动技术，让飞行机器人悬停且不受损伤

[2019-11-06] 哈佛大学研究人员发表在《自然》杂志上的一项最新研究，他们开发了一种由柔软的人造肌肉驱动的机器人蜜蜂（RoboBee），这种机器人在撞墙、 ...

CES 2018：英特尔推出49量子位芯片争夺量子霸权

[2018-01-10] 在与Google、IBM的一场关于建立量子计算系统的马拉松比赛中，英特尔通过了一个关键的里程碑。近日，这个科技巨头已经推出了一个49个量子位 ...

英伟达用联合学习创建医学影像AI 可共享数据和保护隐私

[2019-10-14] 英伟达（Nvidia）和伦敦国王学院（King’s College London）的人工智能研究人员利用联合学习训练了一种用于脑肿瘤分类的神经网络， ...

2018年企业数字化转型的五大趋势

[2017-12-16] 据2016年哈佛商学院研究表明，选择进行数字化转型的企业在3年内表现出了55%的平均毛利润提升，相比之下其他企业毛利润同期降低了37%。数字化转型企业的领头羊，也曾是收入处于......

瑞士研发出微型机器人集群可像蚂蚁一样互相交流并协同工作

[2019-07-12] EPFL（瑞士联邦理工学院）的研究人员受到了蚂蚁的启发，开发了一款仅有10克重的小型机器人：他们可以相互交流，分配角色并完成复杂的任务。 ...

人工智能民主化能否实现取决于科技巨头

[2017-12-29] 我们经常听到像谷歌和微软这样的公司说他们希望人工智能民主化。这是一个很好的词，民主化。但这些公司如何界定“民主化”还不清楚，像AI本身一样，它似乎有点炒作的味道...

美国Natilus公司试飞水上无人货机设计简单成本降低

[2017-12-28] Natilus创业公司成立于2014年，其梦想是建造大型无人机，以半价提供比船舶快得多国际货运。在十二月份，Natilus计划在旧金山湾测试一个9米翼展的小型原型无人机的水上滑行能力......

揭秘达芬奇手术机器人

[2018-04-19] 达芬奇手术系统是由美国Intuitive Surgical公司制造的机器人手术系统。美国食品和药物管理局（FDA）于2000年通过该标准，旨在利用微创手段 ...

本站内容除了特别注明本站原创以外均来自互联网，文章观点不代表本站立场，文章版权归属原作者；如涉及版权问题，请联系smf101@163.com，我们会立即处理。谢谢配合！

本周栏目热点

飞桨火力全开，重磅上线3D模型：PointNet++、PointRCNN！

[2020-03-26] 11 年前的「阿凡达」让少年的我们第一次戴上 3D 眼镜，声势浩大的瀑布奔流而下，星罗棋布飘浮在空中的群山，无一不体现着对生命的敬意， ...

神经网络结构在命名实体识别（NER）中的应用

[2018-01-17] 近年来，基于神经网络的深度学习方法在自然语言处理领域已经取得了不少进展。作为NLP领域的基础任务—命名实体识别（Named Entity Recognition，NER）也不例外，神经网络结......

从基础概念到数学公式，这是一份520页的机器学习笔记（图文并茂）

[2018-06-19] 近日，来自SAP（全球第一大商业软件公司）的梁劲（Jim Liang）公开了自己所写的一份 520 页的学习教程（英文版），详细、明了地介绍了机器学习中的相关概念、数学知识和各......

50行代码玩转生成对抗网络GAN模型！（附源码）

[2018-07-30] 本文为大家介绍了生成对抗网络（Generate Adversarial Network，GAN），以最直白的语言来讲解它，最后实现一个简单的 GAN 程序来帮助大家加深理解。...

深度神经网络揭示了大脑喜欢看什么

[2019-11-06] 爱吧机器人网编者按：近日，《自然-神经科学》发表了一篇论文，研究人员创建了一种深度人工神经网络，能够准确预测生物大脑对视觉刺激所产 ...

谷歌神经翻译又有新进展 基于单一模型无须训练

本周栏目热点

谷歌神经翻译又有新进展基于单一模型无须训练