我理解(如果我的理解错误,请纠正我)CNN的主要目的是减少您使用完全连接的NN时所需的参数数量。 CNN通过提取"功能来实现这一目标。的图像。
CNN可以做到这一点,因为在自然图像中,有一些小的特征,如线条和基本曲线可能出现在"不变的"时尚,并构成像基本构建块的图像。
我的问题是:当我们创建特征地图图层时,例如,其中5个,我们通过使用尺寸的滑动窗口来获得这些,例如,5x5在具有像素的图像上,例如, 100x100,最初,这些特征图被初始化为随机数权重矩阵,并且必须逐渐调整权重和梯度下降吗?但是,如果我们通过使用完全相同大小的窗口获取这些要素图,以完全相同的方式滑动(共享相同的起点和相同的步幅值),在完全相同的图像上,这些地图如何学习不同的特征图像?不知道他们都是一样的,比如一条线还是一条曲线?
是否由于权重矩阵的初始值不同? (即一些权重矩阵比其他权重矩阵更容易学习某个特定的特征?)
谢谢!我写了4个问题/意见并将它们编入索引,以便于单独解决它们!