标签: image-processing machine-learning classification xgboost
这是一个二进制照片分类问题,我使用AlexNet提取了这些功能。测量是对数损失。训练集中共有25000条记录,12500“1”和12500“0”,因此数据集是平衡的。
我训练了一个XGBoost模型。使用交叉验证调整参数后,训练日志丢失为0.078,验证日志丢失为0.09。但是当我使用测试集进行预测时,对数损失为2.1。似乎过度拟合仍然非常严重。
为什么?我是否需要进一步调整参数或尝试其他预先训练的模型?