我目前正在努力深入学习,并且在理解CNN方面存在一个小问题。
根据CS231n,计算转换器输出大小的通用公式。图层为W'=(W−F+2P)/S+1
,其中W
为输入大小,F
为感知字段,P
为填充,S
为步幅。到目前为止,我完全理解了这个公式。
然后是TensorFlow tutorial。根据教程,第一个卷积层的输出大小为28x28x32。为什么不(28-5)/ 1 + 1 = 24→24x24x32,以便第一个汇集层将其减少到12x12x32?我在这里做错了什么?
答案 0 :(得分:2)
这里对于conv层,默认使用SAME
填充。 P=floor(F/2)
填充SAME
。所以(28- 5 + 2*2)/1 +1 = 28