如何在R中导出gbm模型?

时间:2014-10-11 03:43:34

标签: r machine-learning pmml gbm

是否有标准(或可用)方法在R中导出gbm模型? PMML可以工作,但是当我尝试使用pmml库时,可能不正确,我收到错误:

例如,我的代码与此类似:

  library("gbm")
  library("pmml")

  model <- gbm(
      formula,
      data = my.data,
      distribution = "adaboost",
      n.trees = 450,
      n.minobsinnode = 10,
      interaction.depth = 4, shrinkage=0.05, verbose=TRUE)
  export <- pmml(model)
  # and then export to xml

我得到的错误是:

Error in UseMethod("pmml") : no applicable method for 'pmml' applied to an object of class "gbm"

我也试过传递数据集。在任何情况下,我都可以使用另一种我可以编程解析的格式(我将在JVM上进行评分),但如果有办法使PMML工作,PMML会很棒。

1 个答案:

答案 0 :(得分:3)

您可以使用r2pmml package完成工作。目前,它支持回归(即distribution = "gaussian")和二元分类(即distribution = "adaboost"distribution = "bernoulli")模型类型。

以下是Auto MPG dataset的示例代码:

library("gbm")
library("r2pmml")

auto = read.csv(file = "AutoNA.csv", header = TRUE)

auto.formula = gbm(mpg ~ ., data = auto, interaction.depth = 3, shrinkage = 0.1, n.trees = 100, response.name = "mpg")
print(auto.formula)

r2pmml(auto.formula, "/tmp/gbm.pmml")