爱吧机器人网 » 技术 > 机器学习 > 正文

深度学习算法研究现状

人工智能,自古以来就是人类渴望实现的梦想之一。随着二十世纪五十年代电子计算机的出现,人们无疑离梦想近了一大步。时至今日,信息系统已深入到千家万户。而随着信息技术的发展,人工智能也已慢慢揭开了它神秘的面纱。从六十年代的感知器,到七十年代的符号方法,八十年代的神经网络,新千年的语义网,一直到现如今的深度神经网络,人工智能技术正在变得越来越强大,越来越有实用价值。深度学习便是人工智能领域的最新热点。它被广泛的运用在图像识别、语义理解等等方面。近来谷歌研究院的围棋机器人Alpha Go,也部分使用了深度学习技术。可见深度学习技术不但是目前的热点,而且是未来的方向,它将会大有可为。

\
 
深度学习本质上是一种复杂的,层级非常深的神经网络。其基本理论在上世纪八九十年代便已被Yuan Lecun 等人提出。但在当时,由于大规模神经网络的训练极其耗时,相关硬件水平远远不能满足训练深度神经网络的巨大计算量,所以人工神经网络的发展非常缓慢,仅仅处在科研阶段。而神经网络的深度也很浅,大部分网络是仅有两个隐含层的全连接网络。这就使得神经网络的优点无法得到发挥,以至直到本世纪初,学界的热点主要集中在SVM、Ada Boosting、随机森林分类器上。时间到了2012年,基于n VIDIA GPU(Graphics ProcessingUnit)的并行计算技术 CUDA(Compute Unified Device Architecture)被大规模的应用于神经网络计算。GPU 集群的出现,使得利用百万乃至更大级别的数据集训练规模庞大的深度神经网络,从不可能成为了可能,这掀起了神经网络的第二次浪潮。而今,深度学习已在图像识别、语言理解等等领域取得了前所未有的成就,并且逐渐拥有了不少的工程应用。
 
深度学习算法研究现状
 
尽管多层神经网络及其训练算法早在二十世纪八十年代便已被提出。但由于硬件条件限制,当时的神经网络普遍规模不大,以只有两个隐含层的全连接网络为主,仅仅用作单纯的分类器。这严重制约了神经网络的性能,以致其后相当一段时间内,学界与工程界均倾向于使用计算量与所需样本量均小的支持向量机、核方法等模型。直到近几年,GPU 在并行计算领域大放光彩,并被广泛的用于训练大规模深度神经网络,神经网络的颓势才得到了逆转,进而掀起了神经网络的第二次浪潮。
 
深度学习本质上只是一类庞大复杂的、层级深远的神经网络。其中既有卷积神经网络(CNN)这类传统基于监督学习的前馈神经网络,也有诸如深信度网络(DBN)、深度玻尔兹曼机(RBM)、自动编码机(Auto Encode)等半监督模型。随着技术的发展,深度学习在诸如Image Net等大样本复杂状况下显示出了无与伦比的性能。这很大程度上归功于,随着网络层级的增加,深度神经网络可以提取到人手工定义的特征很难触及的高级别特征。例如,对于卷积神经网络而言,卷积层的作用便是特征提取。随着卷积层的增加,图像信息也会由像素级别的特征、浅层特征逐渐提取至高级别深层特征。并且由于特征提取本身也是依靠神经网络自适应得到,避免了人在复杂陌生情况下难以选择合适特征的问题。因此,深度神经网络的泛化性能远不是SVM 或浅层神经网络等模型可以比拟的。
 
2012年的ImageNet 竞赛中,Alex Krizhevshy 等人利用卷积神经网络,在ILSVRC-2012 数据集上取得了远超前人的成绩,这标志着卷积神经网络迎来了它的大发展时期。由于Fine-tune技术以及GPU集群的广泛运用,卷积神经网络一定程度上克服了长久以来的训练困难,样本需求量大的缺点。自此,CNN成为了当前的研究热点,并在各个领域不断取得超越前人的成绩。
 
深度学习技术被广泛的运用在图像识别与自然语言理解领域。微软在中国天津的一次活动上公开演示了一个全自动的同声传译系统,讲演者用英文演讲,后台的计算机一气呵成自动完成语音识别、英中机器翻译和中文语音合成,效果非常流畅,其内在的核心算法便是深度神经网络。而在非图像语音领域,深度学习技术也取得了不错的成果。谷歌研究院的围棋机器人Alpha Go,在其棋局评估器上便使用了深度学习技术中的卷积神经网络,对棋局进行估计。


上一篇:机器学习集成算法:XGBoost思想
下一篇:机器学习:看懂逻辑回归,实现用户分类
精选推荐
麻省理工学院最新研究:优化软体机器人的控制和设计
麻省理工学院最新研究:优化软体机器人的控制和设计

[2019-11-24]  软体机器人属于一个新的领域,它可能在诸如外科手术等领域发挥重要作用(手术时的纳米机器人需要在人体内部移动而不损伤软组织)。软体机器 ...

麻省理工又秀神技:推出如魔法般跳跃的方块机器人集群
麻省理工又秀神技:推出如魔法般跳跃的方块机器人集群

[2019-10-31]  几天前,小编向大家介绍过麻省理工(MIT)研发的一种自组装机器人集群(点此阅览),它们可以用统一标准的小单元自动组装出各种大型结构。 ...

揭秘达芬奇手术机器人
揭秘达芬奇手术机器人

[2018-04-19]  达芬奇手术系统是由美国Intuitive Surgical公司制造的机器人手术系统。美国食品和药物管理局(FDA)于2000年通过该标准,旨在利用微创手段 ...

智能机器人困惑的时候知道该问什么问题
智能机器人困惑的时候知道该问什么问题

[2017-03-20]   照片:Nick Dentamaro 布朗大学 上周,我们提到了麻省理工学院的一些研究,即通过链接人的大脑来帮助机器人在他们将要犯错误的时 ...

MIT用深度学习处理3D点云数据 应用于无人汽车等领域
MIT用深度学习处理3D点云数据 应用于无人汽车等领域

[2019-10-23]  如果你见过自动驾驶汽车,也许会对车顶上那个一直在旋转的圆柱体感到好奇。这是一个雷达传感器,无人驾驶汽车依靠它在现实世界中进行导航。 ...

2023年服务机器人市场将超过250亿美元
2023年服务机器人市场将超过250亿美元

[2017-09-04]  全球服务机器人市场预计到2023年将达到250亿美元, 并在预测期内登记15% 的复合年增长率。短期中期回收期和投资回报率高 (ROI), 以及在教育和研究、临场感、防御、救援和安......

科学家从蟑螂获得启发 教机器人更好地走路
科学家从蟑螂获得启发 教机器人更好地走路

[2017-12-11]  Weihmann指出:“我特别感到惊讶的是,动物运动稳定机制的变化与腿部协调的变化是一致的。昆虫的慢运行非常稳定,因为它的重心很低,三条腿总是以协调的方式运动。...

深度神经网络揭示了大脑喜欢看什么
深度神经网络揭示了大脑喜欢看什么

[2019-11-06]  爱吧机器人网编者按:近日,《自然-神经科学》发表了一篇论文,研究人员创建了一种深度人工神经网络,能够准确预测生物大脑对视觉刺激所产 ...

本周栏目热点

盘点全球十大最具影响力的机器人摇篮

[1970-01-01]    人工智能(AI)研究现正迅速发展,如无人驾驶汽车、计算机在《危险边缘》智力竞赛节目中获胜、数字私人助手Siri、GoogleNow和语音助手C ...

深度学习反向传播算法(BP)原理推导及代码实现

[2017-12-19]  分析了手写字数据集分类的原理,利用神经网络模型,编写了SGD算法的代码,分多个epochs,每个 epoch 又对 mini_batch 样本做多次迭代计算。这其中,非常重要的一个步骤,......

如何在机器学习项目中使用统计方法的示例

[2018-07-23]  事实上,机器学习预测建模项目必须通过统计学方法才能有效的进行。在本文中,我们将通过实例介绍一些在预测建模问题中起关键作用的统计学方法。...

[2017-08-28]  模拟退火(Simulated Annealing,简称SA)是一种通用概率算法,用来在一个大的搜寻空间内找寻命题的最优解。1、固体退火原理:将固体加温 ...

Machine Learning-感知器分类算法详解

[2018-05-31]  今天我们来讲解的内容是感知器分类算法,本文的结构如下:什么是感知器分类算法,在Python中实现感知器学习算法,在iris(鸢尾花)数据集上训练一个感知器模型,自适应线性神......