我正在尝试为makeStackedLearner函数(mlr包)的结果提取系数,其中元学习器适合GLM或类似的东西。了解系数对于了解哪些模型对最终预测的贡献最大。
我已经通过mlr github问题(https://github.com/mlr-org/mlr/issues/2598)提出了这个问题。
library(mlr)
data(BostonHousing, package = "mlbench")
tsk = makeRegrTask(data = BostonHousing, target = "medv")
base = c("regr.rpart", "regr.svm")
lrns = lapply(base, makeLearner)
m = makeStackedLearner(base.learners = lrns,
predict.type = "response", method = "compress")
tmp = train(m, tsk)
在哪里可以找到super.model的回归系数?
> names(tmp$learner.model)
[1] "method" "base.learners" "super.model" "pred.train"
答案 0 :(得分:0)
感谢mlr软件包开发人员,此问题现已解决。最简单的方法是使用SELECT column_name
FROM all_tab_columns
WHERE table_name='integer_table'
LEFT JOIN
SELECT column_name
FROM all_tab_columns
WHERE table_name='text_table';
设置,以便可以轻松地解释最终的超级学习者模型:
super.learner = "regr.glm"