巨头、资本,都在蜂拥进入人工智能领域,布局多元化多维度的应用场景。从家庭机器人到智能音箱,再到最近,机器翻译也成为各家争夺的战场。
一夜间,搜索巨头搜狗杀入硬件,推出搜狗旅行翻译宝;微软联合小米生态链企业发布魔芋AI翻译机;科大讯飞本月将上市新一代讯飞翻译机。还有网易有道翻译蛋、准儿翻译机……俨然已经混战一团。
为什么是翻译?
在《圣经》中,有个关于语言的故事。
上帝造人,人们希望造通天塔找到上帝,这就是巴别塔。但上帝不想人们干成这样的事情,就让人们有了不同的语言,人们无法沟通协作,无法建造这样的塔,无法去找到上帝。
语言是一种非常奇妙的东西,是人类交流信息和情感最本能、最基础的能力。
当人们发明计算机之后,在0和1的世界里,也构建了一个机器语言沟通的规则,于是有了C语言、Java等编程语言。
做搜索,对语言有天生的敏感,所以搜狗、谷歌、百度很早都推出了网络翻译的功能。
但是,在商言商,为什么这一次搜狗要进军硬件呢?为什么是一款智能翻译机?
下面一组数据或许说明了一些初衷:
2017年中国出境旅游人数突破1.3亿人次,花费达1152.9亿美元,中国已是世界第一大出境旅游客源国。
当地球成为地球村,这样频繁的交流无处不在。
用搜狗CEO王小川的话来说,如果通过机器技术,真正打消人们彼此之间跨语言的障碍,能够解决人们之间协作的问题,这是非常伟大的事情,不亚于人类发明电。
而对于自家产品,王小川表示:
搜狗旅行翻译宝精准定位出境游人群,聚焦于解决目前出境旅游翻译产品两大痛点:网络不好和翻译不准。
用搜狗领先的神经网络翻译技术和语音识别技术实现离线语音翻译、离线拍照翻译,我们相信这款产品能够真正帮助国人应对跨语言沟通难题,成为大家出国旅行的必备神器,用中文走遍世界。
天下武功唯快不破
上个月,刘庆峰用了自家的晓译翻译机做演示,有网友怀疑是讯飞的二代翻译机。近期,在科大讯飞微信公众号中,这款机器终于浮出水面。据介绍,这款翻译机可以离线中英互译,多了LCD屏可以支持拍照翻译,在博鳌将为与会嘉宾提供500台,新品发布将在本月20号。
但看过介绍后发现,讯飞高调宣布的离线中英互译与拍照翻译,早在年初就被搜狗旅行翻译宝抢先发布了,且经过不到两个月的迭代,目前搜狗旅行翻译宝已支持24种语言的在线互译,拍照翻译在最新的版本中还支持了中日翻译功能,一键即可开启实景拍摄翻译。
在互联网的世界里,各种技术日新月异,只有快人一步才能稍胜一筹。数据也证明了这个道理,抢先发售的搜狗旅行翻译宝在京东首发当天一小时各地陆续售罄,销售额破1000万。一个刚刚崛起的翻译机,已经让巨头们迅速跑马圈地,鏖战群雄,说到底,拼的还是自身的内功,搜狗都有哪些制胜法宝呢?
翻译机刚推出的时候,就有人提出疑问,为什么有了翻译APP你还要拥有一款翻译硬件在手?其实,离线就是翻译机秒杀翻译APP的杀手锏。这也是为什么继搜狗旅行翻译宝推出离线翻译后,讯飞与有道都在二代中跟进了这项功能。
一方面,出国后国际漫游流量费用高昂,很多人没有开通;另外,千万不要奢望国外WiFi覆盖和4G能像国内这样发达,而且在国外的地铁或景区,往往网络极差——而这恰好是翻译需求高发的地方。这时候,翻译APP基本废掉了,具备离线翻译能力的专业翻译机才该是“拯救外语盲”的首选。
有网的时候看不出区别,没网的时候就一见高下了。就像拳击比赛,玩的就是赤手空拳硬功夫。但离线翻译能力有多强,也是各家翻译机抢夺用户的真枪实弹。
从会议前方有网友拿到了真机测试。以下试验在离线状态进行。
从这个译文来看,这届晓译翻译机不是很给力啊,直接将肯定句翻译成了疑问句不说,也并没有将断句体现出来,光看译文还真不能准确理解原文的意思。反观搜狗的译文结果倒是像模像样,断句也体现的很明显,用词也比较高级。
其实,国外很多地方就是山好水好人好少。有一年,犀利家族在美国自驾,天苍苍野茫茫的高速路上,看到一个不认识的外文招牌,可是等了N久都找不到人来问路。这时候,搜狗旅行翻译宝的推出给翻译行业解决了这一大难题:支持拍照翻译。拍摄需要翻译的内容,比如路牌、菜单等,机器就能直接将图片内的外语内容翻译为中文,不用再逐字费力输入外语,尤其遇到日语,根本不会念,又何谈语音输入啊。
这一功能搜狗本是业内独一份,不过最近博鳌展出的讯飞二代翻译机也加入了这一功能,但是似乎不能离线拍照翻译?
除了这些功能外,能翻译的语种也是翻译机的一大必备技能之一。查看了一些网上现有资料,目前准儿翻译机支持31种语言互译(但没有离线),搜狗旅行翻译宝支持24种语言(中英离线),网易有道翻译蛋支持27种语言(二代中英离线),讯飞晓译翻译机目前支持6种语言(二代中英离线)。
AI与大数据加持
搜狗去年上市的时候,犀利君翻阅了其招股书,发现AI(人工智能)一词出现了近百次,对其AI业务也做了详尽的说明:重点关注自然交互和知识计算,在语音、图像、机器翻译、问答等方面有重大突破,并且已经成功融入搜狗的产品和服务中。从搜狗旅行翻译宝可以窥得其AI布局的一隅。
首先搜狗在AI翻译技术上的实力已经积累多年,2017国际学术赛事WMT (Workshop on Machine Translation) 中,搜狗机器翻译技术就获得了中英机器翻译双向冠军。
翻译宝的语音翻译功能背后,是基于语音识别技术与语音合成技术,在对话翻译上不仅能够将语音识别为文字,还可以将其翻译为目标语言并以语音方式播报译文。
拍照翻译背后,首先是业内领先的OCR识别技术。搜狗在之前的合作伙伴大会上就表示图像识别引擎,日均调用次数超过200万次,可见其OCR识别技术是成熟的。
离线翻译能力背后,翻译宝使用了业界领先的transformer模型,并通过业界领先的神经网络压缩技术将在线模型压缩成大小仅有1/35的离线transformer模型,这样才使得翻译宝在翻译的时候 速度快没有延迟,还能保证翻译水平的精确度。
狭路相逢勇者胜
如今的移动互联网时代,如果你做不了市场的“头个玩家”,那么大概“头号玩家”也将与你无缘——高速发展背后,市场瓜分速度也史无前例的迅猛。这需要的是厂商们的“稳准狠”,还有“快”。
搜狗对AI发力的决心,无疑是稳准狠的。王小川曾多次在公开场合表示:“搜狗将基于对自然语言的交互和计算,将搜索升级到问答系统,将输入法升级到对话系统,并通过翻译将中文世界与全世界连接,成为中国人工智能领域的创新者和引领者”。而事实证明,搜狗在AI领域布局的速度,也很快。
搜狗旅行翻译宝的横空出世,已经为其在“翻译”市场抢跑先开一局。相比于其他厂家的智能翻译机,搜狗旅行翻译宝离线翻译、拍照翻译等功能更是抢先一步。
而早在2016年乌镇世界互联网大会上,搜狗率先实现了同传技术。此后达沃斯区域峰会,CCF-GAIR、香港RISE等大会上,搜狗同传支持了近百场活动。
不仅如此,搜狗快速布局翻译市场还可以追溯到2016年初,搜狗发布的首个跨语言搜索引擎,通过机器翻译与搜索技术的结合,让用户能够用中文查询和阅读英日韩网站的翻译结果;在搜狗输入法中首创性地加入翻译功能,让用户在聊天场景下,能够进行中英日韩语音和文字输入的自动翻译。
狭路相逢勇者胜,2017年人工智能市场涌入的科技公司已足够多,单纯看机器翻译领域就已经有谷歌、微软、搜狗、科大讯飞等公司入场。竞争的道路拥挤不堪,能创新、敢创新的勇者,才将会是未来的胜者——那么,搜狗会是这个胜者吗?我们拭目以待。