实际上,早在一年之前,微软就已经提及过自己的这项神经网络技术,还为它配备了专门的支持神经网络翻译的Microsoft Translator Text and Speech API。从那时起,微软开始扩大神经机器翻译(NMT)的使用范围,以改善所有Microsoft Translator产品和Microsoft Translator Text and Speech API的翻译表现。
和传统的机器翻译相比,微软神经网络翻译在翻译质量上的进步十分明显,今天,微软宣布升级其神经网络,为其再添加10种语言的支持,它们分别是:保加利亚语、捷克语、丹麦语、荷兰语、印地语、挪威语、葡萄牙语、罗马尼亚语、瑞典语和土耳其语。
微软提到,所有简体中文和印地语与中文的互译都默认使用神经网络翻译系统,微软还推出了一种名叫“混合型神经网络翻译”的东西,即使其中一种翻译语言不是神经网络翻译支持的语言,也可以通过神经网络翻译系统改进翻译质量。
在翻译的过程中,如果两种语言之间缺乏可用的训练数据,那么英语将作为两种语言的中间语言,比如要将法语翻译成中文,微软翻译不会走法语-中文的路子,而是走法语-英语-中文的路子,即先把法语翻译成英语,再把英语翻译成中文。传统机器翻译如此,神经网络翻译也不例外。