我正在尝试配置CNN,这需要分析损失函数的结果。我正在使用àVGG-16(CNN)。输入数据是灰度图像。因此,每个像素的值为[0:255]。
对于第一部分,我减去了均值:pixel-127,以使每个图像的[-127:128]范围为。这是此配置的损失/准确性结果:
在这种情况下,开始时会出现一些噪音(从0到25),所以我认为可以通过对数据进行归一化来解决。
因此,我先用:(pixel-127)/ 128更改每个像素,以一种简单的方式进行归一化。这是相同配置的曲线:
噪音消失了,但是现在,火车曲线出现了我从未见过的行为。.如果行为正常,没人能对我说,为什么?而且我想知道您是否知道分析这类曲线的好方法。
谢谢
答案 0 :(得分:2)
看起来您正在非常快地达到收敛,而您正在跳出最小值。尝试降低学习率,使LR衰减或尽早停止。
进行K形折叠可能也很有趣。可能是您的训练集中具有不在测试集中的“硬样本”,并且正在创建这些峰值。
希望有帮助。