卷积神经网络物体检测之感受野大小计算

时间:2022-08-27 21:46:51

近期再看RCNN等经典文章,又看到了“感受野”的概念。再正向传播中我们可以很方便地由前一个feature map通过卷积核,来计算下一个feature map的大小,但是很少去思考:感受野的尺寸(相当于卷积和大小)大小是如何计算的。

首先给两个博客,写的很经典。
博客1

博客2

在RCNN中所说的感受野可以看作是一个“相对的”概念。
比如, 在RRCNN论文中有一段描述,Alexnet网络pool5输出的特征图上的像素在输入图像上有很大的感受野(have very large receptive fields (195 × 195 pixels))和步长(strides (32×32 pixels) ),这里的195,可以将其视为pool5层的一个输出相对于第一层来说,需要多大的卷积核。

计算方法在上面的博客中已经给出,

RF = 1 #待计算的feature map上的感受野大小
for layer in (top layer To down layer):
  RF = ((RF -1)* stride) + fsize

以AlexNet为例,计算过程:
卷积神经网络物体检测之感受野大小计算