评估“交叉验证一个主题”中的效果

时间:2019-05-21 16:03:52

标签: validation machine-learning neural-network cross-validation training-data

我正在设计用于回归问题的神经网络(100个输入-100个隐藏单位-100个输出)。我正在使用ADAM作为优化器,并使用0.3的辍学率进行正则化。

训练数据来自5个不同的科目,因此我正在使用LOSO交叉验证来评估超参数的不同组合(批大小,时期数和学习率)。

例如,考虑主题1: 我使用主题2-5中的特征训练网络(简称为X_cv_train),并使用主题1中的网络评估其性能(命名为X_cv_valid)。

问题是,对于某些对象,在执行LOSO-XV后,其折叠验证集计算出的MSE明显高于其训练集计算出的MSE。

例如,对于主题1,X_cv_train的MSE为0.009,而X_cv_valid的MSE为0.013(似乎是合理的),但对于主题3,X_cv_train的MSE为0.008,而X_cv_valid的MSE为0.04(似乎太高)。

训练集的平均MSE为0.009,而验证集的平均MSE为0.022。

哪种是正确的进行方式?

0 个答案:

没有答案