应用错误收集

为什么在交叉验证后仍然会发生过度拟合？

时间：2016-10-31 19:28:52

标签： image-processing machine-learning classification xgboost

这是一个二进制照片分类问题，我使用AlexNet提取了这些功能。测量是对数损失。训练集中共有25000条记录，12500“1”和12500“0”，因此数据集是平衡的。

我训练了一个XGBoost模型。使用交叉验证调整参数后，训练日志丢失为0.078，验证日志丢失为0.09。但是当我使用测试集进行预测时，对数损失为2.1。似乎过度拟合仍然非常严重。

为什么？我是否需要进一步调整参数或尝试其他预先训练的模型？

0 个答案:

没有答案