如何设想在3色通道的图像上卷积/合并

时间:2016-06-16 07:47:01

标签: tensorflow convolution pooling

我是初学者,我理解mnist教程。现在我想了解一下SVHN数据集。与mnist相比,它配备了3个颜色通道。我很难想象卷积和合并如何与颜色通道的附加维度一起工作。

有没有人有好的方式来考虑它或链接给我?

我感谢所有输入:)

1 个答案:

答案 0 :(得分:3)

这很简单,区别仅在于第一次卷积

  • 在灰色图片中,输入的形状为[batch_size, W, H, 1],因此您的第一个卷积(让我们说3x3)具有形状[3, 3, 1, 32]的滤镜,如果您想要在之后有32个尺寸。
  • 在RGB图像中,输入形状为[batch_size, W, H, 3],因此您的第一个卷积(仍为3x3)具有形状[3, 3, 3, 32]的滤镜。

在这两种情况下,输出形状(步幅为1)为[batch_size, W, H, 32]