在计算SSD对象检测管道的尺寸时,我们发现对于名为" pool3"的图层,带参数:
pooling_param {
pool: MAX
kernel_size: 2
stride: 2
}
输入尺寸为75x75x256(WxHxC) 并根据公式:( Wout = ( Win − kernel + 2*padding )/stride +1),宽度的输出维数为,(75-2)/ 2 = 37.5
但是,本文将此时的输出大小显示为 38 ,同样是此网络的以下代码的输出
net.blobs['pool3'].shape
答案似乎很简单,Caffe框架' ceils'它指的是this post和this one,它应该是'地板'答案应 37
那么有人可以建议Caffe如何处理这些非整数输出尺寸吗?
答案 0 :(得分:0)
有一种叫做填充的东西。当输出要素图不是整数时,输入要素图用0填充。这是一个标准程序,虽然可能没有明确提及。