GBM模型:为什么在H2O R中,网格搜索的验证精度会发生波动

时间:2018-08-24 13:10:47

标签: r h2o

我在R中使用了H2O软件包,并且试图通过gbm模型来提高得分。我尝试使用训练和有效集进行网格搜索。 但是,完成后,两组之间的对数损失曲线非常不同。确实,我的火车布景过拟合,因此准确性高于我的有效布景

Here on H2O, my gbm's parameters :
ntrees = 100, 
max_depth = 3, 
learn_rate = 0.01, 
nfolds = 5,
seed = 1234

您能给我一些解决问题的方法吗?

1 个答案:

答案 0 :(得分:0)

有关在R中调整H2O GBM的帮助,我建议您查看以下调整指南:https://github.com/h2oai/h2o-3/blob/master/h2o-docs/src/product/tutorials/gbm/gbmTuning.Rmd

有很多原因可能导致您使用的预测变量,工程功能,数据拆分方式以及模型调整方式出现过拟合。

如果没有看到您的特定数据集和运行的特定代码,很难为您提供过拟合问题的确切原因。