我正在尝试使用 tidymodels
计算线性模型的变量重要性。据我所知,vip
包用于提取使用 tidymodels
时的重要性。例如,如果我想从随机森林 tidymodels
模型中提取重要性,我会执行以下操作:
library(tidymodels)
aq <- na.omit(airquality)
model_rf <-
rand_forest(
mode = "regression"
) %>%
set_engine("ranger",
importance = "permutation"
) %>%
fit(Ozone ~ ., data = aq)
# variable importance
vip:::vi(model_rf)
这将返回重要性。但是,如果我使用线性模型尝试类似的操作,则会抛出错误。例如:
# create model fit
lm_aq_model <- linear_reg() %>%
set_engine("lm")
lm_fit <- lm_aq_model %>%
fit(Ozone ~ ., data = aq)
vip:::vi(lm_aq_model, method = "permute", target = "Ozone",
metric = "rsquared", pred_wrapper = predict)
> Error in match.call(f, call = mcall) : invalid 'call' argument
我在这里做错了什么?如果我尝试:
aqLM <- lm(Ozone~., data = aq)
vip::vi(aqLM, method = "permute", target = "Ozone",
metric = "rsquared", pred_wrapper = predict)
这有效...为什么我不能让它与 tidymodels
一起工作?
此外,这是在使用 tidymodels
时实际提取重要性的首选方法吗?是否有通用的 tidy 模型函数可以代替 vip::vi(model_fit)
使用?
谢谢
答案 0 :(得分:2)
看起来你给它错误的东西,为什么不给它合适的?这就是 RF 示例所做的。
vip:::vi(lm_fit, method = "permute", target = "Ozone",
metric = "rsquared", pred_wrapper = predict)