用 GPU来搭建人工智能的神经网络,Facebook、Amazon、Salesforce都拥有了基于GPU的云计算能力,国内的科大讯飞也采用了GPU 集群支持自己的语音识别技术。GPU的这一优势被发现后,迅速承载起比之前的图形处理更重要的使命:被用于人工智能的神经网络,使得神经网络能容纳上亿个节点间的连接。传统的CPU集群需要数周才能计算出拥有1亿节点的神经网的级联可能性,而一个GPU集群在一天内就可完成同一任务,效率得到了极大的提升。另外,GPU随着大规模生产带来了价格下降,使其更能得到广泛的商业化应用。
2.3.2大数据训练可以有效提高人工智能水平
机器学习是人工智能的核心和基础,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。该领域的顶级专家Alpaydin先生如此定义:“机器学习是用数据或以往的经验,以此优化计算机程序的性能标准。”
我们已经进入到大数据时代,来自全球的海量数据为人工智能的发展提供了良好的条件。
根据IDC的监测统计,2011年全球数据总量已经达到1.8ZB(1ZB等于1万亿GB,1.8ZB也就相当于18亿个1TB的移动硬盘,人均 200GB,这些信息的量相当于可以填充572亿个32GB的iPad),而这个数值还在以每两年翻一番的速度增长,预计到2020年全球将总共拥有 35ZB的数据量,增长近20倍。
2.3.3“深度学习”技术的出现
“深度学习”是机器学习研究中的一个新的领域,它模拟人类大脑神经网络的工作原理,将输出的信号通过多层处理,将底层特征抽象为高层类别,它的目标是更有效率、更精确地处理信息。深度学习自2006年由GeoffreyHinton教授和他的两个学生被提出后,使得机器学习有了突破性的进展,极大地推动了人工智能水平的提升。2013年,《麻省理工技术评论》把它列入年度十大技术突破之一。
人脑具有一个深度结构,认知过程是逐步进行,逐层抽象的,能够层次化地组织思想和概念。深度学习之所以有如此大的作用,正是因为它较好地模拟了人脑这种“分层”和“抽象”的认知和思考方式。
深度学习的实质,是通过构建具有很多隐层的机器学习模型和海量的训练数据,来学习更有用的特征,从而最终提升分类或预测的准确性。因此,“深度模型”是手段,“特征学习”是目的。区别于传统的浅层学习,深度学习的不同在于:1)强调了模型结构的深度,通常有5层、6层,甚至10多层的隐层节点;2)明确突出了特征学习的重要性,也就是说,通过逐层特征变换,将样本在原空间的特征表示变换到一个新特征空间,从而使分类或预测更加容易。与人工规则构造特征的方法相比,利用大数据来学习特征,更能够刻画数据的丰富内在信息。
深度学习使得人工智能在几个主要领域都获得了突破性进展:在语音识别领域,深度学习用深层模型替换声学模型中的混合高斯模型(GaussianMixtureModel,GMM),获得了相对30%左右的错误率降低;在图像识别领域,通过构造深度卷积神经网络(CNN),将Top5错误率由26%大幅降低至15%,又通过加大加深网络结构,进一步降低到11%;在自然语言处理领域,深度学习基本获得了与其他方法水平相当的结果,但可以免去繁琐的特征提取步骤。可以说到目前为止,深度学习是最接近人类大脑的智能学习方法。
深度学习引爆了一场革命,将人工智能带上了一个新的台阶,将对一大批产品和服务产生深远影响。
2.3.4“人脑”芯片将从另一个方向打开人工智能的大门
前面提到了现代计算机的冯·诺依曼体系结构阻碍了大规模并行计算的实现,导致人工智能发展受限。而今天人工智能发展面临突破,除了上文说的云计算、大数据、深度学习三个原因之外,另外一个方向的努力也是不容忽视的,那就是彻底改变了冯·诺依曼体系结构的“人脑”芯片。
“人脑”芯片,也叫神经形态芯片,是从硬件方向对人脑物理结构的模拟。这种芯片把数字处理器当作神经元,把内存作为突触,跟传统·冯诺依曼结构不一样,它的内存、CPU和通信部件是完全集成在一起,因此信息的处理完全在本地进行。而且由于本地处理的数据量并不大,传统计算机内存与CPU之间的瓶颈不复存在了。同时神经元之间可以方便快捷地相互沟通,只要接收到其他神经元发过来的脉冲(动作电位),这些神经元就会同时做动作。
3.人工智能产业发