为什么在卷积神经网络中3个通道进入3通道滤波器时只产生1个通道

时间:2017-12-03 08:37:00

标签: python neural-network computer-vision deep-learning conv-neural-network

enter image description here

我想了解为什么带有3 * 3 * 3过滤器的3个通道像6 * 6 * 3的图像只产生4 * 4 而不是4 * 4 * 3

2 个答案:

答案 0 :(得分:1)

当您应用卷积时,它会对您的内核权重输出乘以输入值求和。在这种情况下,您不会对输入进行任何填充,这意味着您只输出完全定义的值。如果将输入的维度设为(x,y,z),则可以看到内核在x和y维度上较小,但在z中相等。这意味着您可以在x和y方向上滑动内核,为每个位置生成输出,但是在z方向上它无处可滑动,因此它只生成单个输出(这是所有通道的总和)。

答案 1 :(得分:1)

一种方法是考虑从6 x 6 x 3矩形棱镜中切割和抓取多少个3 x 3 x 3立方体。

另外,让我们让问题更简单。

假设您有2 x 2输入图像补丁,并且您想要进行2 x 2卷积。有多少种方法可以将2 x 2卷积拟合到输入图像补丁= 1 x 1(x方向1,y方向1)

让我们扩展它:4 x 2输入图像,2 x 2转换。独特的卷积计数= 3 x 1(x方向3个,y方向1个等)

让我们扩展它:4 x 4输入图像,2 x 2转换。唯一卷积计数= 3 x 3

让我们扩展它:4 x 4 x 2输入图像,2 x 2 x 2转换。唯一卷积计数= 3 x 3 x 1

让我们扩展它:6 x 6 x 3输入图像,3 x 3 x 3转换。独特的卷积计数= 4 x 4 x 1