卷积过程是卷积神经网络最主要的特征。然而卷积过程有比较多的细节,初学者常会有比较多的问题,这篇文章对卷积过程进行比较详细的解释。
1、卷积运算
首先我们需要知道什么是卷积计算,它其实是一种简单数学运算,有两个步骤:一个是矩阵内积乘法,另一个是将内积乘法的结果进行全加。
(1)矩阵内积乘法
矩阵的内积乘法非常简单,就是把两个相乘的矩阵,相同位置的元素进行乘法运算,这个时候会得到一个新的矩阵(在这里我们需要注意一下,卷积是在作矩阵内积乘法,而不是矩阵乘法)。
(2)全加计算
这个新矩阵的全部值会进行相加,然后会得到一个值,这个值才是卷积运算的结果。
卷积计算过程如下图所示:
2、特征图像与卷积核
对于实际的卷积过程中,它一方面有输入图像,这些图像被称作是特征图像(注:卷积神经网络中,原始的输入是真实的图像,经过卷积后会生成特征图像),另一方面还需要有卷积核。
卷积核的值是人为设定的,它是可以调节的,在实际的卷积神经网络中,卷积核的值就是网络的参数。对卷积网络进行训练,就是在调节这些卷积核心的参数。在实际中一般不会用太大的卷积核,常见的卷积核大小有3*3,5*5,1*1的大小。
特征图像和卷积核都是以矩阵的形式存在,因此它们可以进行卷积计算。卷积计算的输入不仅可以是图像,还可以是其它的二维矩阵信息(当然还有一维和三维的卷积,这里就不多介绍了)。卷积核首先会对特征图像的第一个区域进行卷积运算,这个卷积计算的结果,会作为输出特征图像上的一个点,如下图所示。
3、卷积核在特征图像上的滑动过程
每次卷积计算的结果会作为输出特征图像的一个点,而特征图像在进行卷积过程后,会输出一幅新的特征图像,这需要卷积核与特征图像进行多次卷积计算。形象的来说,卷积核会在输入的特征图像上滑动。这个滑动的过程,一般是沿着从左到右,从上到下这样的次序。如下图所示。
这里还需要注意的是滑动的步长,上面所说的是滑动的步长为1的情况。滑动的步长还可以取不为1的情况,不同的滑动步长,输出特征图的大小不同,如下图所示。
4、多通道特征图像的卷积过程
使用一个卷积核对一幅特征图像进行卷积之后,会产生一幅新的特征图像,所以我们很自然的能想到,使用多个卷积核对特征图像进行卷积会得到多幅特征图像。在一个实际卷积神经网络中通常有很多个卷积层次,每个卷积层都有很多个卷积核,那么在每个层次也会产生很多幅特征图像,这些特征图像的数目,被称为是“通道”数目。
此时会面临一个问题是,怎样对多个通道的特征像进行卷积。这个时候我们需要对卷积核进行分组,每组卷积核的数目,对应的是输入通道特征图像的数目,而输出通道的数目是卷积核一共有多少组。所以总的卷积核心数目是:输入通道数目*输出通道数目。
另外还需要注意的是,每组卷积核心通常还有一个偏置项,所以下图的卷积过程是,第一组的三个卷积核进行卷积计算后的结果,再加上一个偏执项的值,才是输出特征相应位置的值。
还需要注意的是,输入特征图的外围经常会填充一圈的零,这样的处理是为了让特征图边缘的值能对准卷积核,可以减少一些信息的损失。
下面两幅图是多通道卷积过程的示意图。
后记
理解卷积过程对于学习深度神经网络非常重要,在这篇文章对卷积过程进行了较为详细的解释。其实基本的卷积过程并不复杂,但是有一些细节需要多去思考才能消化。另外现在人们对卷积神经网络特性,也有了越来越深入的认识......
智能风电系统是提升海上风电运维可靠性的数字抓手
The Freestyle三星投影仪:强大的投影功能和高清画质技术
毫米波人体成像设备将取代金属探测门用于民用机场
纳智捷锐3 旗舰版全方位测评
苹果正在研发折叠屏iPhone可能会在5G手机之后推出
详解卷积神经网络卷积过程
基于Linux2.6的YAFFS文件系统移植
人类历史上推力最大的火箭,在发射前几分钟突然被叫停!
传新版Model3即将上市,特斯拉在国内促销清库存?
ARM微处理器对异常中断的响应过程
芯片后端signoff的RC corner指什么?
物联网 vs 区块链 vs 人工智能, 哪个才是你的菜?
你知道国产双机热备与双机冷备的意思吗
变压器过励磁
超140家零售商与科技公司联手改善AR/VR购物体验
机器视觉知识要点
百度推出小度电视伴侣 朝着家居控制中心的战略前行
虹科新闻 |2022元宇宙荣誉榜创新硬件榜单新鲜出炉,虹科榜上有名
Redis可以实现消息中间件MQ的功能
是德科技推出新的800G测试解决方案