在CNN中,滤镜通常在空间上设置为3x3、5x5。尺寸可以与图像尺寸媲美吗?原因之一是减少了要学习的参数数量。除此之外,还有其他关键原因吗?例如,人们想首先检测边缘吗?
答案 0 :(得分:1)
您回答了问题的要点。另一个原因是,大多数这些有用的功能可能会在图像的多个位置中找到。因此,在整个图像上滑动单个内核是有意义的,希望可以使用同一内核在图像的不同部分提取该特征。如果您使用的是大内核,则功能可能会交错并且无法具体检测到。
除了您自己回答外,减少计算成本也是关键点。由于我们对图像中的不同像素集使用相同的内核,因此当我们对它们进行卷积时,这些像素集将共享相同的权重。而且,由于权重的数量少于完全连接的层,因此我们可以减少向后传播的权重。