我使用Adam优化器构建了两个CNN分类器。其中一个我应用了辍学(.05),第二个我应用了辍学。每种情况下,我都获得了以下准确性和损失值,哪个表现更好?我注意到它们两者的准确性都相当,但是具有辍学特征的分类器的损失结果更好,波动更少。
下面,分类器的第一张图片启用了辍学(0.5),第二张图片未启用辍学
答案 0 :(得分:2)
您添加的辍学减轻了过拟合的影响;从本质上讲,这就是损耗图不像没有丢失/未添加任何其他正则化的情况那样剧烈振荡的原因。
即使在没有缺失/正则化模型的情况下,即使验证集的准确性可能稍好(提高1-2%),您也应该期望第二个模型(包括缺失)在看不见的数据上表现更好(测试集)。
应该选择辍学模型;另外,您可以尝试使用辍学的不同阈值来检查性能。另外,最好有一个测试集来快速验证您的任何假设。
请注意,您将验证集用作测试集,但是它们具有不同的用途。您实际显示的是训练验证损失/准确性,而不是训练测试损失/准确性。