如何从h2o.gbm
计算条件排列的重要性?
我有一个数据集,其中包含许多高度相关的变量(> 0.9)。并将此数据集送入h2o.gbm
。事实证明,当我降低相关变量时,RMSE会增加(在CV上)。
现在,我试图获得可变的重要性,并发现了以下功能:h2o.varimp()
。 (我猜)这与经典的party::varimp(model, conditional = T)
不同。
答案 0 :(得分:0)
这是一个重复的问题,您可以找到以前发布的答案here和here。
简短的回答是,这在H2O-3中目前不是一种选择,有关其他选择,请参见上面的链接问题。
为此问题还创建了一张吉拉票,您可以在此处跟踪和评论:https://0xdata.atlassian.net/browse/PUBDEV-4027