例如,对于famous AlexNet architecutre
(original paper),使用two 3*3 convolution filters
与使用one 5*5 convolution filter
有什么区别?
two 3*3 convolution filters
和one 5*5 convolution filter
在下图中用red rectangle
突出显示了。
使用另一个5*5 convolution filter
取代two 3*3 convolution filters
,反之亦然吗?
答案 0 :(得分:0)
我从论文<<Very Deep Convolutional Networks for Large-Scale Image Recognition>>
中找到了。
而不是在第一次转换中使用相对较大的感受野。层(例如,Krizhevsky等人,2012年步幅为4的11×11,或(Zeiler&Fergus,2013; Sermanet等人,2014年)步幅为2的7×7,我们使用非常小的3×3接收层整个网络中的所有场都与每个像素的输入进行卷积(步长为1)。不难看出,两个3×3的转换层(在它们之间没有空间合并)的堆栈具有5×5的有效接收场。三个这样的层具有7×7的有效接收场。
两个3 * 3卷积滤波器等效于一个5 * 5卷积滤波器。
两个3 * 3卷积滤波器比一个5 * 5卷积滤波器具有更少的参数。
两个3 * 3卷积滤波器将比一个5 * 5卷积滤波器使网络更深入,提取的特征也更复杂。
答案 1 :(得分:0)