为什么仅使用非重要重要性功能进行重建时h2o.gbm会生成不同的模型

时间:2018-07-13 15:43:32

标签: r h2o gbm

不幸的是,我无法在刚刚试验过的开源数据上重现此问题(由于商业敏感性,我无法提供存在问题的原始数据)。但是,...

我已在具有一组参数并将种子设置为1的数据集上构建了一个h2o.gbm()。如果我采用其特征重要性> 0的特征,然后构建一个新的gbm(所有与之前,但指定的功能要少一些),那么我将获得一个完全不同的模型!

怎么可能?

我将尝试提供可复制的内容,但与此同时,任何见识将不胜感激。如果我还不够清楚,很高兴澄清这个问题。

谢谢, 汤姆

1 个答案:

答案 0 :(得分:0)

没关系-我发现了问题:列采样是罪魁祸首!

显然这不是一个错误,但是需要注意。