我在R中使用了H2O软件包,并且试图通过gbm模型来提高得分。我尝试使用训练和有效集进行网格搜索。 但是,完成后,两组之间的对数损失曲线非常不同。确实,我的火车布景过拟合,因此准确性高于我的有效布景
Here on H2O, my gbm's parameters :
ntrees = 100,
max_depth = 3,
learn_rate = 0.01,
nfolds = 5,
seed = 1234
您能给我一些解决问题的方法吗?
答案 0 :(得分:0)
有关在R中调整H2O GBM的帮助,我建议您查看以下调整指南:https://github.com/h2oai/h2o-3/blob/master/h2o-docs/src/product/tutorials/gbm/gbmTuning.Rmd。
有很多原因可能导致您使用的预测变量,工程功能,数据拆分方式以及模型调整方式出现过拟合。
如果没有看到您的特定数据集和运行的特定代码,很难为您提供过拟合问题的确切原因。