2016年,击败围棋世界冠军李世石九段的AlphaGo震惊世人,随之引爆的AI大潮如雨后春笋。近年来,人工智能技术频频亮相,已然成为炙手可热的全球科技新宠。业内人士评价,如果说以蒸汽技术驱动的第一次工业革命延伸了人的肢体,拓展了人类的力量,那么,以新一代人工智能技术为驱动的新一轮科技革命和产业变革将拓展人类的智能,极大提升人类智力所能创造的价值。
“2016-2018年,AI非常火爆。” 3 月 27 日的云知声AI 技术开放日上,云知声董事长兼CTO梁家恩谈及AI技术时表示,但他同时认为,AI大潮正在退却,原因是有些伪AI公司已经消失,而真正的AI公司还在继续。“真AI和伪AI公司不仅在技术实力上有明显差距,他们对产业问题的态度也是区别比较大的。到今天当AI大潮退去,我们可以站出来说,AI真正的时代到来。”
AI技术结合产业才有未来
关于人工智能,官方解释为,AI是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。梁家恩认为,AI是一种技术,但如果不跟产业结合,就只是一种纯粹的炫技。
追溯AI发展这起伏变动的60多年,共经历了三次浪潮。1956年的Dartmouth会议后,人们陆续发明了第一款的感知神经网络软件和聊天软件,证明了数学定理。彼时,大家都惊呼“人工智能来了,再过十年机器要超越人类了”,然而直到70年代后期,人们发现过去的理论和模型只能解決一些非常简单的问题。很快,AI第一次浪潮被拍在沙滩上。
随着1982年Hopfield神经网络和BT训练算法的提出,外界又有了“人工智能春天来临”的呼声。于是80年代又兴起一波人工智能的热朝,包括语音识别、语音翻译计划,以及日本提出的第五代计算机。到了90年代后期,人们再次发现这种东西离实际生活还很遥远。即使IBM在90年代时提出了一款名为“IBM Viavoice”的语音听写软件,在演示当中效果不错,但真正用的时候却很难使用。2000年左右,第二次人工智能的浪潮又一次破灭。
第三次人工智能浪潮是随着2006年 Hinton提出的深度学习的技术,以及在图像、语音识别以及其他领域内取得的一些成功而开启的。业界普遍认为经过两次起伏,人工智能开始进入了真正爆发的前夜。
“AI过去两次浪潮都没有跟产业结合。” 梁家恩称,而第三次浪潮更大的背景是万物智联的时代,这是一个互联网的延伸,从PC互联到移动互联,再到未来万物互联才是真正的主战场。在这个战场上,除了AI技术之外,还有IOT、5G等技术的逐渐成熟落地,所有这些技术的结合,会给人们生活带来天翻地覆的变化。“互联网未来从线上沉入到线下,改变我们的消费和整个产业升级,在这个时代会有很大的机会来临。”
据梁家恩介绍,云知声基于在移动端的三年探索,发现语音助手在手机上的运用和电视上的运用活跃度相差20倍以上,从而得到启发:只有AI技术跟硬件以及跟整个物联网产业结合,才有未来。
从AI企业来看,据了解,百度AI能力正逐渐被应用于医疗、零售、农业和金融等各个领域。去年12月份,百度宣布成立“百度AI产业研究中心”,该中心将与产业、学术、研究机构携手,探索各产业呈现出的新应用、新模式、新业态、新价值。腾讯围绕着计算机视觉、智能语音、机器人控制、NLP自然语言处理等AI技术全面布局。网易也正在通过AI+教育消除城乡教育鸿沟。可见行业已经普遍意识到,唯有加强人工智能和产业发展的融合,培育新增长点、形成新动能,以人工智能技术推动各产业变革,推动人工智能和商业场景的深度融合,才能真正实现商业化落地。
“全栈”、“硬核”两大挑战
在当下AI 技术驱动的产业变革浪潮中,要服务好消费与产业升级的需求,技术与应用的挑战是十分艰巨的。从云知声的AI 技术分享会上,记者获取到两个象征行业挑战的关键要素——“全栈”和“硬核”。
全栈可以从两个维度解读,第一个维度是如何构建多模态生态拟人化智能系统。以云知声为例,以语音交互起家的云知声,其目前为止的技术图谱已经超过了语音能力范围,包括感知和认知和表达能力,用视觉和听觉、降噪和语音识别、对话管理系统、行业智能系统、人脸和语音合成,最终反馈给用户。据梁家恩透露,云知声最终想构建的便是多模态生态拟人化智能系统。
要实现这个目的,需要解决两个问题:落地问题和快速响应问题。“我们有两块,一个是智能芯片,另外一个是超算平台,一个解决我们落地的问题,一个解决快速响应的问题。” 这是梁家恩或者说云知声对全栈的理解。
第二个维度是如何打通完整的产业闭环,把感知和表达的技术真正跟认知结合。“我们有一个从0到1、从1到10。从1到10在技术领域已经比较完美了,但是对产业来说,从1到10才是刚开始。”梁家恩表示,能不能从10做到60分,60分意味着什么,这需要解决产业里面融合性的产品体系,包括整个技术方案能不能达到量产要求等,这主要是功能和产品运维的挑战。
全栈打通以后,产业规模化应用的痛点如何解决?这就需要有足够强的技术支撑,也即“硬核”。硬核技术涉及四个方面,一是语音技术,语音技术方向非常成熟,但在产业落地上的挑战非常大;二是机器智能水平的提升,因为它代表大脑,如果只是鹦鹉学舌,是不能解决产业问题的;三是AI芯片落地,这需要较长时间的技术积累,云知声从2014年开始布局AI芯片,2016年动工,到2018年才拿到第一块芯片,并且还在不断完善的过程中;四是超算能力,超算能力在延伸图像翻译时,能够得到非常快的演进。梁家恩认为超算平台对于云计算的价值,就相当于高铁对于中国经济发展价值,“可以让我们的运转体系提高不止一倍以上的效率。”但如何搭建一个真正强大的超算平台,这同样是一项挑战。
基于以上关于“全栈”和“硬核”的两个关键难点,梁家恩的分析中也提到的云知声的突破:2016年开始挑战远场识别,做一些工程和技术方面的打磨。同年开始布局芯片、超算平台和云计算。2018年拿到芯片,超算平台开始铺开,同期把全栈的技术构建起来,为AI技术与产业的融合发展奠定了很大的基础。
“让机器更好的服务人类”是整个AI行业以及所有AI企业都需要去努力的方向与目标。总结而言要解决三个问题:一是多模态的交互,能不能变成多模态拟人化的交互能力是重点;二是行业问题的解决,“我们不是要颠覆这个行业,而是要进入行业里面去,看这个产业有什么问题。” 梁家恩称,有些问题是能够通过人工智能技术解决的问题,那么就通过去解决行业问题来推动AI行业的发展。三是底层创新能力支撑,只靠当下的技术能力推进并不足以改变整个AI行业,只有包括芯片、超算、
机器学习和认知学习等底层创新能力不能提升与突破,才能更好的面对未来的行业挑战,以及获得更好的发展。
2019年之于AI,是最好的时代,也是最坏的时代。“伪AI退却,真AI前行”是梁家恩给予今年
人工智能行业的预判,“AI的大时代已经到来了,但是对于伪AI企业已经消失,只要我们扎扎实实的把行业问题解决掉,市场就会给予最大的回报。”