爱吧机器人网 » 技术 > 神经网络 > 正文

谷歌神经翻译又有新进展 基于单一模型无须训练

大家都知道,欧盟拥有24种官方语言,理想情况下,欧盟的翻译官们应该能够随时从一种语言直译到另一种语言,但这种翻译组合实在是太多了,高达576种,所以他们选择英语当做中间语言来解决这一问题。

同样地,我们的谷歌工程师们也面临着同样的问题,但谷歌面临的麻烦要更大一点,因为他们需要翻译的语言种类要比欧盟的官方语言多,达到100多种,(例如:英语翻法语是一种组合,而法语翻英语又是另一种组合),而这些翻译组合会高达上万种。

如果为每一种组合训练一种神经翻译模型的话,那么就需要训练上万个。真的是好多啊!但是现在不要了,我们只需要一个模型就可以解决这些问题。近日,来自谷歌的工程师门发表了一篇论文,上面提到如何只用一个模型实现多语言之间的翻译。这个模型被称为NMT模型。 NMT模型的训练不需要任何语言学知识,且具有模型简单、翻译质量高等优点。它基于原有的单一语言翻译模型,但不需要对原有翻译模型进行任何修改,便可实现多语言之间的翻译。

论文显示这种新方法有三个优点:

一、简单,即减少需要训练的模型数;

二、改善翻译质量。尤其是那些训练语料不足的语言;

三、具有‘zero shot’翻译能力,即如果我们训练一个模型可以将葡萄牙语翻译成英语,然后在训练一下让其可以实现英语到西班牙语之间的翻译,此时神奇的一幕出现了,我们虽然并没有进行葡萄牙语到西班牙语之间的翻译,但是此时模型仍然可以实现葡萄牙语到西班牙语之间的正确翻译。

谷歌宣称这是世界首次研发出zero-shot翻译。很明显,zero-shot 还具有明显的速度优势,它可以使解码时间减半。 其另一个优势就是可以实现句间转换。如果一个句子中包含不止一种语言,它照样可以翻译。这样如果一个大的数据集中如果包含多种语言,那么它照样可以实现翻译。论文的最后,谷歌翻译人员用BLEU方法对翻译结果进行评判,发现结果改善不少。

实际上,神经机器翻译还有很长的路要走。谷歌貌似已经将NMT 推广到了其它语言翻译上,例如英语到德语的翻译。在我们对谷歌翻译进行的随机测试中,我们发现其翻译流畅度有所提升,但仍有一些漏翻或误翻。

上一页12下一页

上一篇:深度神经网络会产生人这样的智能吗?
下一篇:人工神经网络matlab源程序代码
精选推荐
Crossbar将电阻式RAM推入嵌入式AI
Crossbar将电阻式RAM推入嵌入式AI

[2018-05-17]  电阻RAM技术开发商Crossbar表示,它已与航空航天芯片制造商Microsemi达成协议,允许后者在未来的芯片中嵌入Crossbar的非易失性存储器。此举是在先进制造业节点的领先代工厂选......

如何让人工智能机器人快速自我纠正错误并吃一堑长一智?
如何让人工智能机器人快速自我纠正错误并吃一堑长一智?

[2017-08-23]  莱斯特大学数学系的研究人员在《Neural Networks》杂志上发表了一篇文章,概述了新算法的数学基础,可以使人工智能收集错误报告并立即纠正,而不影响现有技能 ,同时还会积......

美国人工智能公司Skymind进入福建全面开展业务
美国人工智能公司Skymind进入福建全面开展业务

[2017-12-11]  人工智能在当今这个时代对大家来说想必是非常熟悉的,这也是我国近十几年来一直追求的目标,未来的时间里这也将是全人类追求的目标。就目前来看,近年来,人工智能或在我国迎......

MIT最新“人机”互连系统 让双腿机器人复制人体技能
MIT最新“人机”互连系统 让双腿机器人复制人体技能

[2019-11-01]  MIT的小爱马仕想借用你的大脑 ,图片来自: João Ramos爱吧机器人网消息,麻省理工学院(MIT)的研究人员展示了一种新型遥操作系 ...

2022年全球工业机器人市场将达到790亿美元
2022年全球工业机器人市场将达到790亿美元

[2017-09-04]  预计到 2022年, 全球工业机器人市场将达到790亿美元, 并在预测期内登记11 5% 的复合年增长率。随着发展中国家中小型企业需求的不断增长, 采用自动化技术以确保生产质量......

什么是机器人学?机器人学简介
什么是机器人学?机器人学简介

[2017-12-14]  机器人学是工程学与科学的交叉学科,包括机械工程,电气工程,计算机科学等。机器人技术涉及机器人的设计、制造、操作和应用,以及用于控制、感官反馈和信息处理的计算机系统。...

助力卷积神经网络时空特征学习 史上最大行人重识别视频数据集被提出
助力卷积神经网络时空特征学习 史上最大行人重识别视频数据集被提出

[2017-12-25]  本文提出了一个大型的、长序列的、用于行人重识别的视频数据集,简称LVreID。与现有的同类数据集相比,该数据集具有以下特点:1)长序列:平均每段视频序列长为200帧,包含丰......

机器人iCub作为嵌入式AI的标准机器人研究平台的重要性
机器人iCub作为嵌入式AI的标准机器人研究平台的重要性

[2017-12-24]  机器人的研究在过去10年中得益于一个具有嵌入式人工智能(AI)的标准化开源平台——人形机器人iCub。iCub最初在意大利被创建,如今在欧洲、美国、韩国、新加坡和日本的实验室......

本周栏目热点

飞桨火力全开,重磅上线3D模型:PointNet++、PointRCNN!

[2020-03-26]  11 年前的「阿凡达」让少年的我们第一次戴上 3D 眼镜,声势浩大的瀑布奔流而下,星罗棋布飘浮在空中的群山,无一不体现着对生命的敬意, ...

从基础概念到数学公式,这是一份520页的机器学习笔记(图文并茂)

[2018-06-19]  近日,来自SAP(全球第一大商业软件公司)的梁劲(Jim Liang)公开了自己所写的一份 520 页的学习教程(英文版),详细、明了地介绍了机器学习中的相关概念、数学知识和各......

50行代码玩转生成对抗网络GAN模型!(附源码)

[2018-07-30]  本文为大家介绍了生成对抗网络(Generate Adversarial Network,GAN),以最直白的语言来讲解它,最后实现一个简单的 GAN 程序来帮助大家加深理解。...

神经网络和模糊逻辑的工作流

[2016-11-20]   行业观察 神经网络 和模糊逻辑的工作流 null 来源:神州数码erp 发布时间: 2009-10-14 9:06:01 关键词: 工作流,协同,B2B,OA  以下 ...

深度神经网络揭示了大脑喜欢看什么

[2019-11-06]  爱吧机器人网编者按:近日,《自然-神经科学》发表了一篇论文,研究人员创建了一种深度人工神经网络,能够准确预测生物大脑对视觉刺激所产 ...