我的CNN模型在MNIST数据集上的准确度高达99.4%。所以我尝试一些不规则的输入。并且预测结果不正确。
以下是我使用的一些不规则输入
众所周知,CNN卷积将扫描整个图像,也不关心图像区域的关键特征。
为什么CNN无法处理不正常的输入
答案 0 :(得分:1)
众所周知,CNN卷积将扫描整个图像,也不关心图像区域的关键特征。
这简直是假的。 CNN没有"扫描"图像,单个过滤器可以看作扫描,但整个网络没有。 CNN由多个层组成,最终将减少信息量,并且在某些时候还使用特定于位置的特征(在最终完全连接的层中,在一些全局平均中等等)。因此,虽然CNN对小扰动(平移或噪声,但不是旋转!)具有鲁棒性,但它们对这些变换不是不变。换句话说 - 将图像向左移动3个像素很好,但是尝试将数字分类为完全不同的比例/位置将会失败,因为没有任何东西强迫你的模型不变。确实学习这种不变性的一些模型是空间变形网络,但CNN根本就没有。