深度学习反向传播算法（BP）原理推导及代码实现-机器学习-技术-爱吧机器人网

深度学习反向传播算法（BP）原理推导及代码实现

2018-01-12 算法channel 浏览量：

昨天，分析了手写字数据集分类的原理，利用神经网络模型，编写了SGD算法的代码，分多个epochs，每个 epoch 又对 mini_batch 样本做多次迭代计算。这其中，非常重要的一个步骤，便是利用反向传播（BP）算法求权重参数的梯度，偏置量的梯度。下面根据以下几个问题展开BP算法：

什么是BP算法？

为什么叫做反向传播？

如何构思BP算法的切入点？

误差是如何传播开的？

如何求出权重参数的梯度和偏置量的梯度？

链式规则是怎么一回事？

1、统一符号表达

神经网络每个神经元的连接关系，用符合如何表达呢？下面定义一种表达方式，如下图所示，含有一个隐含层的神经网络，图中标出的w的含义为：第三层的第2个神经元与第二层的第4个神经元间的权重参数。

再看下，标红色箭头的神经元的偏移量 b，如图所示进行标记，第二层中第3个神经元的偏移量；标绿色箭头的神经元的输出 a 为如下图所示标记，为第三层中第一个神经元的输出。

第 L 层第 j 个神经元的输出等于，前1层即 L-1 层中所有神经元的带权的输入和，然后再映射到sigmoid激活函数中，得到如下公式所述：

一定要仔细理解这种上述公式的各个符号表达，它是理解以下对 BP 算法论述的前提。

2、BP算法推导

2.1 公式1

如下图所示，有个精灵跑到了网络中，假设位于第L层，第 j 个神经元的门口处，它引起了一点扰动，

，

z的含义是加权输入项，容易得出这个扰动项对成本函数造成的损失可以定义为：

那么，类推的，可以看出在输出层 L，误差项的定义表达为如下，第一个公式

上式是根据链式规则可以推导得出，成本函数的改变首先是有第L层第j个神经元的输出项影响的，然后第 j 个神经元的输出又受到第 L层第 j 个神经元的干扰 z 影响，因此得到上式。这个式子的意义是定义了第 L层第 j个神经元的误差项怎么求，注意这里L可是输出层哦，那么如何求出第 L-1层中某个神经元的损失项（误差项）呢？

2.2 公式2

这就用到第二个公式，它给出了怎么由第 L层的误差推导出第L-1层的误差，先给出第二个公式：

那么，这个公式，是如何得出的呢？这里面，这个公式是相对最难想的，推导过程如下：

还是从损失项的定义入手，

由以上这几个式子，就可以得出公式2 。

2.3 公式3

那么有了以上的分析，我们便能求解处任意层的损失项了，可以得出成本函数对某层某个神经元的梯度为，这是第三个公式：

还是可以由链式规则得出吧，如下推导过程：

2.4 公式4

成本函数对权重参数的梯度为，这是第四个公式：

那么这个公式还是可以由链式规则得出，对其推导如下：

推导第三，四个公式，都用到了以下这个基本知识：

2.5 反向传播代码

根据这四个公式，可以得出BP算法的代码，每个步骤将公式放到上面，方便查看。

def backprop(self, x, y):

01 占位

nabla_b = [np.zeros(b.shape) for b in self.biases]

nabla_w = [np.zeros(w.shape) for w in self.weights]

02 前向传播求出每个神经元的输出项

activation = x

activations = [x] # 分层存储每层的输出项（对应上文中的 a）

zs = [] # 分层存储每层的 z 向量（对应上文中的 z）

for b, w in zip(self.biases, self.weights):

z = np.dot(w, activation)+b

zs.append(z)

activation = sigmoid(z)

activations.append(activation)

#activations[-1] 必须是最后一层

delta = self.cost_derivative(activations[-1], y) * sigmoid_prime(zs[-1])

03 求偏置量的梯度

nabla_b[-1] = delta

04 求权重参数的梯度

nabla_w[-1] = np.dot(delta, activations[-2].transpose())

05 反向传播，依次更新每层的每个神经元的权重和偏移量

# L = 1 表示最后一层神经元， L = 2 倒数第二层神经元

for layer in range(2, self.num_layers):

z = zs[-layer]

sp = sigmoid_prime(z) #sigmoid函数的导数

delta = np.dot(self.weights[-layer+1].transpose(), delta) * sp

nabla_b[-layer] = delta

nabla_w[-layer] = np.dot(delta, activations[-layer-1].transpose())

return (nabla_b, nabla_w)

def cost_derivative(self, output_activations, y):

return (output_activations-y)

以上就是BP算法的详细推导过程。

精选推荐

南加州大学机器人学家：机器人更适合粗暴的爱

[2019-11-07] 图片来自JOHN MADERE GETTY IMAGES打是疼骂是爱，当人类粗暴的将物体从机器人手中敲掉，看似残忍，实际上却能帮助机器人找到最好的握持物 ...

英国首台月球车是个小型四腿机器人将于2021年登月

[2019-10-12] 探测器将用四条腿探测月球表面，并将数据传回着陆器，后者将把数据传回地球图詹姆斯温斯皮尔英国即将成为继美国、俄罗斯、中国之后的又一 ...

7种常见的机器人焊接类型

[2017-12-17] 机器人焊接是工业领域最常见的机器人应用之一，近几十年来主要由汽车行业驱动。机器人焊接在完成大批量，重复性的焊接任务时效率最高。...

助力卷积神经网络时空特征学习史上最大行人重识别视频数据集被提出

[2017-12-25] 本文提出了一个大型的、长序列的、用于行人重识别的视频数据集，简称LVreID。与现有的同类数据集相比，该数据集具有以下特点：1）长序列：平均每段视频序列长为200帧，包含丰......

研究人员融合人类与AI的创造力显著提高了深度学习的表现

[2019-10-12] 由加拿大人工智能领域研究主席、滑铁卢大学系统设计工程教授Alexander Wong领导的一个团队开发了一种新型紧凑型神经网络家族，可以在智能 ...

谷歌宣布搜索算法重大升级，用BERT模型理解用户搜索意图

[2019-10-26] 谷歌刚刚宣布，其搜索引擎的核心算法正在进行一项重大升级，这项升级可能会改变10%的搜索结果排序。此项升级应用了自然语言处理技术（BERT ...

谷歌大脑发布ROBEL基准鼓励用低成本机器人训练AI系统

[2019-10-11] 训练AI系统的机器人D& 39;Claw和D& 39;Kitty用于控制机器人的人工智能系统，测量其性能所使用的基准通常仅限于为工业环境设计的昂贵硬件， ...

英伟达用联合学习创建医学影像AI 可共享数据和保护隐私

[2019-10-14] 英伟达（Nvidia）和伦敦国王学院（King’s College London）的人工智能研究人员利用联合学习训练了一种用于脑肿瘤分类的神经网络， ...

本站内容除了特别注明本站原创以外均来自互联网，文章观点不代表本站立场，文章版权归属原作者；如涉及版权问题，请联系smf101@163.com，我们会立即处理。谢谢配合！

本周栏目热点

盘点全球十大最具影响力的机器人摇篮

[1970-01-01] 　　人工智能（AI）研究现正迅速发展，如无人驾驶汽车、计算机在《危险边缘》智力竞赛节目中获胜、数字私人助手Siri、GoogleNow和语音助手C ...

深度学习反向传播算法（BP）原理推导及代码实现

[2017-12-19] 分析了手写字数据集分类的原理，利用神经网络模型，编写了SGD算法的代码，分多个epochs，每个 epoch 又对 mini_batch 样本做多次迭代计算。这其中，非常重要的一个步骤，......

如何在机器学习项目中使用统计方法的示例

[2018-07-23] 事实上，机器学习预测建模项目必须通过统计学方法才能有效的进行。在本文中，我们将通过实例介绍一些在预测建模问题中起关键作用的统计学方法。...

Machine Learning-感知器分类算法详解

[2018-05-31] 今天我们来讲解的内容是感知器分类算法，本文的结构如下：什么是感知器分类算法，在Python中实现感知器学习算法，在iris（鸢尾花）数据集上训练一个感知器模型，自适应线性神......

模拟退火算法（SAA）

[2017-08-28] 模拟退火（Simulated Annealing，简称SA）是一种通用概率算法，用来在一个大的搜寻空间内找寻命题的最优解。1、固体退火原理：将固体加温 ...