我想使用pmml库导出Caret随机森林模型,因此我可以将其用于Java中的预测。 这是我得到的错误的再现。
data(iris)
require(caret)
require(pmml)
rfGrid2 <- expand.grid(.mtry = c(1,2))
fitControl2 <- trainControl(
method = "repeatedcv",
number = NUMBER_OF_CV,
repeats = REPEATES)
model.Test <- train(Species ~ .,
data = iris,
method ="rf",
trControl = fitControl2,
ntree = NUMBER_OF_TREES,
importance = TRUE,
tuneGrid = rfGrid2)
print(model.Test)
pmml(model.Test)
Error in UseMethod("pmml") :
no applicable method for 'pmml' applied to an object of class "c('train', 'train.formula')"
我正在谷歌搜索一段时间,发现实际上很少有关于导出到PMML的信息,一般来说pmml库中有随机森林:
methods(pmml)
[1] pmml.ada pmml.coxph pmml.cv.glmnet pmml.glm pmml.hclust pmml.itemsets pmml.kmeans
[8] pmml.ksvm pmml.lm pmml.multinom pmml.naiveBayes pmml.nnet pmml.randomForest pmml.rfsrc
[15] pmml.rpart pmml.rules pmml.svm
它使用直接随机森林模型,但没有经过训练的插入符号。
library(randomForest)
iris.rf <- randomForest(Species ~ ., data=iris, ntree=20)
# Convert to pmml
pmml(iris.rf)
# this works!!!
str(iris.rf)
List of 19
$ call : language randomForest(formula = Species ~ ., data = iris, ntree = 20)
$ type : chr "classification"
$ predicted : Factor w/ 3 levels "setosa","versicolor",..: 1 1 1 1 1 1 1 1 1 1 ...
...
str(model.Test)
List of 22
$ method : chr "rf"
$ modelInfo :List of 14
..$ label : chr "Random Forest"
..$ library : chr "randomForest"
..$ loop : NULL
..$ type : chr [1:2] "Classification" "Regression"
...
答案 0 :(得分:4)
您无法使用pmml
或train
类型调用train.formula
方法(即,这是model.Test
对象的类型。)
train
方法的Caret文档说明您可以访问finalModel
字段中的最佳模型。您可以在该对象上调用pmml
方法。
rf = model.Test$finalModel
pmml(rf)
不幸的是,事实证明Caret使用&#34;矩阵接口&#34;来指定RF模型。 (即通过设置x
和y
字段),而不是使用更常见的&#34;公式界面&#34; (即通过设置formula
字段)。 AFAIK,&#34; pmml&#34;包不支持这种RF模型的导出。
因此,看起来您最好的选择是使用两级方法。首先,使用Caret包为您的数据集找到最合适的RF参数化。其次,使用&#34;公式界面&#34;手动训练最终的RF模型。这种参数化。
答案 1 :(得分:1)
您可以使用r2pmml
package来完成工作:
library("caret")
library("r2pmml")
data(iris)
train.rf = train(Species ~ ., data = iris, method = "rf")
print(train.rf)
r2pmml(train.rf, "/tmp/train-rf.pmml")