理解文章中关于VGGNet的一段话

时间:2018-01-05 10:54:42

标签: machine-learning deep-learning classification conv-neural-network imagenet

我不明白文章中关于VGGNet的一段话。也许有人可以提供帮助。

在我看来,卷积层中的权重数是

p=w*h*d*n+n

其中w是滤镜的宽度,h是滤镜的高度,d是滤镜的深度,n是滤镜的数量。

在文章中写道如下:

假设三层3×3 onvolution堆栈的输入和输出都有C通道,堆栈参数化为3 *(3 ^ 2 * C ^ 2)= 27C ^ 2 权重;同时,单个7×7转。层需要7 ^ 2 * C ^ 2 = 49C ^ 2参数。

我不明白,这里的渠道是什么意思,以及为什么使用这个公式。

有人可以向我解释一下吗?

提前致谢。

1 个答案:

答案 0 :(得分:1)

你的直觉是正确的;我们只需要解释一下他们的解释。对于第一种情况:

w = 3 # filter width
h = 3 # filter height
d = C # filter depth (number of channels is same as number of input filters; eg RGB is C=3)
n = C # number of output filters/channels

然后生成whdn = 9C^2个参数。然后,他们还说有三个堆叠在一起,所以27C^2

对于单个7x7过滤器,它们都是相同的7x7xCxCx1

最后的区别是,您在原始帖子的末尾再次添加n;这是偏见条款,在VGG中它们会跳过(许多人会跳过偏见条款;它们的价值在某些情况下是有争议的)。