找出R H2O AutoML模型最有贡献的变量/特征?

时间:2018-04-23 11:36:45

标签: r variables h2o contribute

我目前正在处理一些保险数据,以预测客户将会落入何种保险金额级别。为了达到这个目的,我使用了R中H2O软件包的AutoML功能。现在我有了我的模型,我希望能够看到我的数据中哪些变量/特征对预测贡献最大。模特制作。用H2O可以做到这一点吗?如果没有,用R实现这一目标的另一个好方法是什么?谢谢!

1 个答案:

答案 0 :(得分:2)

绝对有可能。如果AutoML选择的最佳拟合模型不是整体,那么您可以使用以下内容绘制变量重要性(模型是从AutoML中提取的model),

library(h2o)
h2o.varimp_plot(model)

如果最合适的模型是一个整体,那么事情就会复杂一些。一个好的选择是使用lime包来查看本地重要性。

 library(h2o)
 library(lime)

 ## Train explainer
 explainer <- lime(train, model)

 ## Get explanations for a subset of samples
 explanation <- explain(train[1:5, ], explainer, n_features = 10)

 ## Plot global explanations
 plot_explanations(explanation)

 ## Plot local explanations
 plot_features(explanation)