前言

我的研究生方向是图像处理,也用到了深度学习工具,所以这部分相对熟悉一些。在学习过程中,也发现了一些以前没有注意到的知识,比如卷积这个词是怎么从数学转到神经网络的一种操作的。

感受野

卷积核是在局部窗口内操作的,所以,卷积核的大小反映了学习到的范围。浅层的时候,卷积核的感受野只有图像的一小部分;随着网络的变深,后面的卷积核能看到前面的,其感受野最终能大等于整张图。

填充和步幅

目前图像处理最常用的卷积核大小、填充和步幅组合是(3,1,1)。这样的卷积不会使输出特征图的尺寸发生变化。如果要使图像的尺寸缩小,还可以用池化层。

填充可以增加输出的高度和宽度。这常用来使输出与输入具有相同的高和宽。步幅可以减小输出的高和宽,例如输出的高和宽仅为输入的高和宽的 1/𝑛(𝑛 是一个大于 1 的整数)。