有什么方法可以从h2o.gbm中获得条件排列的重要性?

时间:2018-10-10 15:25:39

标签: r h2o

如何从h2o.gbm计算条件排列的重要性?

我有一个数据集,其中包含许多高度相关的变量(> 0.9)。并将此数据集送入h2o.gbm。事实证明,当我降低相关变量时,RMSE会增加(在CV上)。

现在,我试图获得可变的重要性,并发现了以下功能:h2o.varimp()。 (我猜)这与经典的party::varimp(model, conditional = T)不同。

1 个答案:

答案 0 :(得分:0)

这是一个重复的问题,您可以找到以前发布的答案herehere

简短的回答是,这在H2O-3中目前不是一种选择,有关其他选择,请参见上面的链接问题。

为此问题还创建了一张吉拉票,您可以在此处跟踪和评论:https://0xdata.atlassian.net/browse/PUBDEV-4027