Question

我使用卷积神经网络（通过Keras）作为我的面部表情识别模型（55名受试者）。我的数据集非常难，大约450k，有7个班级。我根据每个科目和每个班级标签平衡了我的训练集。

我实现了一个非常简单的CNN架构（具有实时数据增强功能）：

在第一个时代之后，我的训练损失不断减少，而验证损失增加。很快会过度拟合吗？或者我的数据是否存在混淆问题？我还应该平衡我的测试集吗？

Answer 1

这可能是任务很容易解决，在一个时代之后，模型已经学会了足够的解决方法，而对更多时代的训练只会增加过度拟合。

但是如果你已经平衡了火车组而不是测试组，那么可能发生的是你正在训练一项任务（对均匀分布的数据进行表达识别）然后你正在测试一个稍微不同的任务，因为测试集不平衡。