我有一个初学者的问题,但我无法解决这个问题。
输入图像为512 * 512。在输入图像2上执行单独的操作并连接:
3 * 3卷积,步幅2有13个过滤器
max-pooling operation
连接后结果似乎是16个特征图,我不确定如何?
任何建议,答案或阅读材料都会非常有用。
答案 0 :(得分:1)
如果一层接一层地应用,则输出将不会有16
个要素图,而是13
。但是如果它们是并行,那么输入通道的数量C=3
就足够了。
让我们一个接一个地浏览各个层次:
(B, 512, 512, 3)
,其中B
为批量大小。(B, 256, 256, 13)
或(B, 255, 255, 13)
,具体取决于所使用的填充(请参阅此问题中的公式:A formula to find the size of a matrix after convolution)。(B, 256, 256, 3)
或(B, 255, 255, 3)
。(B, 256, 256, 16)
或(B, 255, 255, 16)
,因为16=13+3