博客
关于我
卷积神经网络六之CNN反向传播计算过程
阅读量:340 次
发布时间:2019-03-04

本文共 1494 字,大约阅读时间需要 4 分钟。

CNN反向传播计算过程

  • 传统的神经网络是全连接形式的,如果进行反向传播,只需要由下一层对前一层不断的求偏导,即求链式偏导就可以求出每一层的误差敏感项然后求出权重和偏置项的梯度,即可更新权重。
  • 卷积神经网络有两个特殊的层:卷积层和池化层。池化层输出时不需要经过激活函数,是一个滑动窗口的最大值,一个常数,那么它的偏导是1。池化层相当于对上层图片做了一个压缩,这个反向求误差敏感项时与传统的反向传播方式不同。从卷积后的feature_map反向传播到前一层时,由于前向传播时是通过卷积核做卷积运算得到的feature_map,所以反向传播与传统的也不一样,需要更新卷积核的参数。

2、CNN卷积层反向传播

例子:输入是一个4*4 的image,经过两个2*2的卷积核进行卷积运算后,变成两个3*3的feature_map

以卷积核filter1为例  (stride = 1 ):

计算第一个卷积层神经元o11的输入NetO11和输出Out011:

Neto11=conv(input,filter)

             =i11×h11+i12×h12+i21×h21+i22×h22

             =1×1+0×(−1)+1×1+1×(−1)=1

Outo11=activators(neto11)=max(0,neto11)=1

 

示例:

同样的方法,计算所有神经元的输入和输出:(此处使用Relu激活函数)

 

Outo11=activators(neto11)=max(0,neto11)

Outo12=max(0,neto12)

Outo13=max(0,neto13)

Outo21=max(0,neto21)

Outo22=max(0,neto22)

Outo23=max(0,neto23)

Outo31=max(0,neto31)

Outo32=max(0,neto32)

Outo33=max(0,neto33)

neto11=i11×h11+i12×h12+i21×h21+i22×h22

neto12=i12×h11+i13×h12+i22×h21+i23×h22

neto13=i13×h11+i14×h12+i23×h21+i24×h22

neto21=i21×h11+i22×h12+i31×h21+i32×h22

neto22=i22×h11+i23×h12+i32×h21+i33×h22

neto23=i23×h11+i24×h12+i33×h21+i34×h22

neto31=i31×h11+i32×h12+i41×h21+i42×h22

neto32=i32×h11+i33×h12+i42×h21+i43×h22

neto33=i33×h11+i34×h12+i43×h21+i44×h22

计算池化层的输入和输出:

netm11=max(o11,o12,o21,o22)=1

outm11=netm11=1

3、数学计算过程

(1)(链式求导)

首先计算卷积的上一层的第一个元素i11的误差项δ11:

然后对输入元素i(i,j)求偏导:

同样的方法计算其他元素对误差的偏导。

(2)观察一下上面几个式子的规律,归纳一下,可以得到如下表达式:

图中的卷积核进行了180°翻转,与这一层的误差敏感项矩阵Delta( i,j ),

周围补零后的矩阵做卷积运算后,就可以得到E/i11 :

权重的梯度:

偏置项的梯度:

根据梯度即可修改权重。

 

二、CNN可视化

CNN 可视化:滤波器

深度卷积核检测图像更高层次的特征

CNN的应用

计算机视觉:人脸识别、无人超市、自动驾驶、医学影像诊断

 

转载地址:http://hffr.baihongyu.com/

你可能感兴趣的文章
紫书——蛇形填数
查看>>
吐泡泡(栈)
查看>>
刷题计划1——poj1753
查看>>
Specialized Four-Digit Numbers——进制转换
查看>>
第一场
查看>>
蓝桥杯备战——刷题(2019)
查看>>
kuangbin题单 进阶搜素 深度优先搜索 哈密顿绕行世界问题 HDU2181
查看>>
谷歌最新提出无需卷积、注意力 ,纯MLP构成的视觉架构
查看>>
ArcMap|栅格计算器报错
查看>>
批量把多个csv/txt合成一个csv/txt
查看>>
《小石潭记》古文鉴赏
查看>>
Matlab中有关字符串数组的常见问题解答
查看>>
未定义的变量“py”或函数“py.command”
查看>>
我们,都一样......(句句入心)
查看>>
两个数求最大公约数和最小公倍数的方法和理解
查看>>
总结了一下c/c++函数和变量的命名规则
查看>>
关于构造函数内调用虚函数的问题
查看>>
最短路径问题—Dijkstra算法
查看>>
求二叉树的深度
查看>>
录音功能
查看>>