为什么在CNN中用于图像识别任务,总是将滤镜选择为极端本地化?

时间:2019-03-12 18:27:20

标签: computer-vision conv-neural-network image-preprocessing

在CNN中,滤镜通常在空间上设置为3x3、5x5。尺寸可以与图像尺寸媲美吗?原因之一是减少了要学习的参数数量。除此之外,还有其他关键原因吗?例如,人们想首先检测边缘吗?

1 个答案:

答案 0 :(得分:1)

您回答了问题的要点。另一个原因是,大多数这些有用的功能可能会在图像的多个位置中找到。因此,在整个图像上滑动单个内核是有意义的,希望可以使用同一内核在图像的不同部分提取该特征。如果您使用的是大内核,则功能可能会交错并且无法具体检测到。

除了您自己回答外,减少计算成本也是关键点。由于我们对图像中的不同像素集使用相同的内核,因此当我们对它们进行卷积时,这些像素集将共享相同的权重。而且,由于权重的数量少于完全连接的层,因此我们可以减少向后传播的权重。