我正在观察一层CNN二进制分类模型中的以下模式:
根据过去的SO问题和文献综述,这些模式似乎表明过度拟合(该模型在训练中表现良好,但不能推广到新的例子)。
以下图形说明了训练中步数的损失和准确性。
两者都
我考虑过的传统疗法以及对它们的观察:
所有这些,我要问的是:
谢谢-任何见识将不胜感激。
答案 0 :(得分:3)
我认为您完全正确。看起来像经典的过拟合。
一个选择是添加辍学(如果您还没有的话)。它属于正则化类别,但现在比L1和L2正则化更常用。
更改模型架构可能会获得更好的结果,但是很难说具体是什么。它可能有助于通过增加更多的层(可能还有一些合并层)来使其更深。它可能仍会过拟合,但在此之前您可能会获得更高的开发集准确性。
获取更多数据可能是您可以做的最好的事情之一。如果无法获取更多数据,则可以尝试扩充数据。您也可以尝试清除数据以消除噪音,这有助于防止模型拟合噪音。
您最终可能希望尝试设置超参数优化搜索。但是,这在神经网络上可能要花费一些时间,而神经网络需要花费一些时间进行训练。确保在进行超参数调整之前删除测试集。