展加速明显
技术“奇点”的到来使得人工智能发展明显加速,这从产业层面能够得到有力的佐证:我们已经能够看到IT业对人工智能的投入显著加大,新型的应用或产品也不断问世。
3.1 国际IT巨头频频放“大招”
IT领域的国际巨头近年来在人工智能领域频频发力,一方面网罗顶尖人才,一方面加大投资力度,这也昭示着人工智能新的春天已经到来。
2013年3月,谷歌以重金收购DNNresearch的方式请到了GeoffreyHinton教授(上文提到的深度学习技术的发明者);2013年 12月,Facebook成立了人工智能实验室,聘请了卷积神经网络最负盛名的研究者、纽约大学终身教授YannLeCun为负责人;2014年5月,有 “谷歌大脑之父”美称的AndrewNG(吴恩达)加盟百度,担任首席科学家,负责百度研究院的领导工作,尤其是“百度大脑”计划。这几位人工智能领域泰斗级人物的加入,充分展示了这些互联网巨头对人工智能领域志在必得的决心。
根据量化分析公司Quid的数据,自2009年以来,人工智能已经吸引了超过170亿美元的投资。仅去年一年,就有322家拥有类似人工智能技术的公司获得了超过20亿美元的投资。自2013年以来,Yahoo、 Intel、Dropbox、LinkedIn、Pinterest以及Twitter也都收购了人工智能公司。过去四年间,人工智能领域的民间投资以平均每年62%的增长速率增加,这一速率预计还会持续下去。
3.2 新的AI应用和产品屡有惊喜
1 自然语言处理(NLP)
微软Skype Translator同声传译
SkypeTranslator是由Skype和微软机器翻译团队联合开发,整合了微软Skype语音和聊天技术、机器翻译技术、神经网络语音识别打造了一款面向消费者用户的产品,2014年5月在微软Code大会上推出。两个不同语种的人借助SkypeTranslator可实现无障碍交谈,当你说出一个完整的句子后,系统便会开始进行记录翻译,对方即可听到翻译后的句子,并可通过字幕显示在屏幕上。这个实时语音翻译系统能够识别不同用户间的不同语言不同口音的说话方式。
目前,SkypeTranslator还处在早期开发阶段,但这一实时语音翻译功能有可能帮助改变世界未来的交流方式。比如在线教育,2014年12月,微软正式推出了SkypeTranslator预览版,让来自美国和墨西哥的小学生使用各自母语就能进行语音通话。它可以识别美国小学生的英文语句并将其翻译为西班牙语,然后以文本的形式呈献给墨西哥小学生,反之亦然。微软计划将SkypeTranslator服务推向教育领域,如此一来全世界各地的学生都能无障碍聆听任何语言的课程,显然这对于促进全球教育进步有着非比寻常的意义。
2 计算机视觉(CV)
(1)格灵深瞳的智能视频监控系统
在安防领域,摄像头已经得到大规模的使用,但监控的有效性依然面临两个严峻的挑战:
1、摄像头只能起到记录功能,识别还要依靠人眼,真正能实时监控到的场景非常有限:一个像机场大小的公共场所,摄像头的数量能够达到几万台,而同一时间负责监控视频的安保人员大概只有几个人;此外,视频监控往往都采用画面轮播机制,每过一定时间自动切换屏幕上显示的监控视频画面。所以,那些真正有信息价值的画面被人看到、注意到的几率就很小。
2、难以有效查询历史记录。据估计全球监控视频记录的存储已经消耗了75%的硬盘资源,以某广场为例,每天产生的监控视频数据,刻成光盘摞起来,甚至超过埃菲尔铁塔的高度。要在如此庞大的数据库里依靠人眼寻找某个特定画面或犯罪嫌疑人,需要动用大量的人力资源,并且效率低下。
格灵深瞳是一家专注于开发计算机视觉的人工智能公司,致力于让计算机像人一样主动获取视觉信息并进行精确的实时分析。公司成立于2013年初,成立不久就获得真格基金和联创策源的天使投资,并于2014年6月获得红杉资本数千万美元的A轮投资。
格灵深瞳通过研发三维视觉感知技术,实现对人物的精确检测、跟踪,对动作姿态(包括暴力、跌倒等危险行为)和人物运动轨迹(包括越界、逆行、徘徊等可疑轨迹)的检测和分析。在自动场景和人物检测的基础上,自动给安保人员提供预警信号,主动提醒、报告异常,保障安保人员“看得到”。同时,格灵深瞳利用感知技术抽象出人物的特征,从非时间的维度进行监测、跟踪、搜索,真正做到“找得到”。
目前格灵深瞳的视频监控系统已经在对安防要求较高的银行进行应用测试。如果该技术