连接后的要素图

时间:2018-02-04 10:40:56

标签: machine-learning computer-vision deep-learning concatenation conv-neural-network

我有一个初学者的问题,但我无法解决这个问题。

输入图像为512 * 512。在输入图像2上执行单独的操作并连接:

  1. 3 * 3卷积,步幅2有13个过滤器

  2. max-pooling operation

  3. 连接后结果似乎是16个特征图,我不确定如何?

    任何建议,答案或阅读材料都会非常有用。

1 个答案:

答案 0 :(得分:1)

如果一层接一层地应用,则输出将不会有16个要素图,而是13。但是如果它们是并行,那么输入通道的数量C=3就足够了。

让我们一个接一个地浏览各个层次:

  • 输入为(B, 512, 512, 3),其中B为批量大小。
  • 卷积层将此输入张量转换为(B, 256, 256, 13)(B, 255, 255, 13),具体取决于所使用的填充(请参阅此问题中的公式:A formula to find the size of a matrix after convolution)。
  • 最大池化会像卷积层一样更改空间维度,但不会更改批量大小和通道数。因此输出将为(B, 256, 256, 3)(B, 255, 255, 3)
  • 假设conv和max-pool图层具有相同的参数,并且沿第4轴进行连接,则连接结果将为(B, 256, 256, 16)(B, 255, 255, 16),因为16=13+3