一组微软研究团队于本周三宣布,他们已经创造了第一个能够将中文新闻翻译成英文的机器翻译系统,精确度与人类译者一致。该公司表示,它通过来自各种在线报纸的约2000条语句样本对这一系统进行了反复测试,并将测试结果与人类译者的翻译进行了比较,它还甚至聘请了外部的双语顾问来进一步验证机器的精确度。
这一被称为newstest2017的样本集已于去年秋天在研究会议WMT17上发布。
令人感到惊讶的是研究人员能够如此快速的达到这一里程碑,尤其是机器翻译是人们几十年来一直在试图解决的问题。
微软指出,许多人甚至认为达到与人类相同水平的目标可能永远无法实现。
负责微软语音、自然语言和机器翻译工作的技术专家黄学东,在微软的一篇博文中表示:“在机器翻译任务中达到人类水平是我们所有人的梦想,我们只是没有意识到能够这么快实现这一目标。”
让机器在这一规模上理解语言远比语音识别复杂得多。AI和语音识别的进步让语音助手能够嵌入我们的智能手机之中,帮助消费者处理日常计算任务,控制智能家居设备以及用于新闻和娱乐目的。
但是要求机器对网页或新闻文章进行翻译往往会出现难以理解的单词混乱,虽然可以让你对所说的内容有一个大致的了解,却无法进行深度的理解。
要真正理解长篇文章中的内容,你需要人的帮助。
但不同的人工翻译会以一种稍微不同的方式来翻译一个句子。
“机器翻译要比单纯的模式识别任务复杂得多,”微软亚洲研究院助理总监兼自然语言处理小组负责人周明说道。“人们可以使用不同的单词来表达相同的意思,但你无法判断哪一种更好。”
微软还指出,最近在AI方面取得的进展,为研究人员实现这一里程碑作出了贡献。
深度神经网络——一种训练AI系统的方法,允许研究人员创造更加流利自然的翻译,并考虑到更广泛的内容背景,这一超前的方法被称之为统计机器翻译。
微软的研究人员还在系统中增加了他们自己的训练方法,以提高其精确度。这些方法类似于人们如何重复自己的工作时间,并再次确认是否正确的过程。
研究人员表示,他们使用的方法包括双重学习的事实检查翻译;审议网络,进行重复翻译和改进;联合训练等新技术,以迭代促进英到中和中到英翻译系统;以及协议正规化,即通过左到右和右到左阅读语句来生成翻译。
周明表示,用于实现这一里程碑的技术不会局限于机器翻译。“这是机器翻译研究可以应用于人工智能研究全部领域的领域,”周明表示。
此外,它可以在未来让其他语言的翻译更加准确和自然。研究人员表示,这一系统尚未在实时新闻报道中测试过,在该技术被商业化到微软产品前还有其他的挑战需要解决。
但是你可以在微软的网站上使用这一新的翻译系统:https://translator.microsoft.com/neural。
系统将显示一个中文(简体)句子,然后以两种方式进行翻译,右边的翻译会更加完善以表明这一技术的先进性。
机器翻译是谷歌的研究人员一直致力于研究的内容,包括使用谷歌的
机器学习技术进行中英文查询。这些进展已经付诸实施,以改进谷歌面向消费者的产品,比如谷歌翻译
应用,以及谷歌搜索的整合。
本文来自猎云网,如若转载,请注明出处:https://www.lieyunwang.com/archives/420312