我使用卷积神经网络(通过Keras)作为我的面部表情识别模型(55名受试者)。我的数据集非常难,大约450k,有7个班级。我根据每个科目和每个班级标签平衡了我的训练集。
我实现了一个非常简单的CNN架构(具有实时数据增强功能):
T
在第一个时代之后,我的训练损失不断减少,而验证损失增加。很快会过度拟合吗?或者我的数据是否存在混淆问题?我还应该平衡我的测试集吗?
答案 0 :(得分:4)
这可能是任务很容易解决,在一个时代之后,模型已经学会了足够的解决方法,而对更多时代的训练只会增加过度拟合。
但是如果你已经平衡了火车组而不是测试组,那么可能发生的是你正在训练一项任务(对均匀分布的数据进行表达识别)然后你正在测试一个稍微不同的任务,因为测试集不平衡。