为什么在交叉验证后仍然会发生过度拟合?

时间:2016-10-31 19:28:52

标签: image-processing machine-learning classification xgboost

这是一个二进制照片分类问题,我使用AlexNet提取了这些功能。测量是对数损失。训练集中共有25000条记录,12500“1”和12500“0”,因此数据集是平衡的。

我训练了一个XGBoost模型。使用交叉验证调整参数后,训练日志丢失为0.078,验证日志丢失为0.09。但是当我使用测试集进行预测时,对数损失为2.1。似乎过度拟合仍然非常严重。

为什么?我是否需要进一步调整参数或尝试其他预先训练的模型?

0 个答案:

没有答案