卷积的输出

时间:2018-10-21 07:19:35

标签: neural-network conv-neural-network image-size

假设我们有一个5x5大小的图像和一个3x3大小的内核, 大步前进2,继续前进。经过神经网络的卷积层后,输出图像的大小是多少。

2 个答案:

答案 0 :(得分:1)

另一个答案是正确的,但这是一张图形,该图形直观地说明了此公式成立的原因: enter image description here

I:图像尺寸,K:内核尺寸,P:填充,S:步幅

我将仅解释一个方向的公式(将过滤器向右移动),因为另一个方向的公式相同。

想象一下,您将内核(过滤器)放置在填充图像的左上角。

然后,右侧还有 I-K + 2P 像素。如果跨度为S,则可以将内核放在此剩余部分的 floor((I-K + 2 * P)/ S)位置。您可以验证具有4x4像素的图像是否需要“底色”。您必须为内核的初始位置添加一个,以获得内核位置的总数。

因此,总共有个((I-K + 2 * P)/ S)+ 1 位置-这是您的输出大小的公式。 希望有帮助。

答案 1 :(得分:0)

让我们考虑一个更一般的情况:

输入是大小为I * I的图像。输入用P * P像素填充。内核的大小为K * K,步幅为S * S。然后,输出具有O * O大小,可以使用一个简单的公式进行计算:

O = [(I + 2 * P-K)/ S] +1;其中[]显示下限功能。

所以,您的回答是3 * 3,因为O = [(5 + 2 * 1-3)/ 2] + 1 = 3。