我有以下randomForest
。
我可以按如下方式提取有关它的信息(使用tree
)。
library(randomForest)
model <- randomForest(Species ~ ., data=iris, importance=TRUE, ntree=5, mtry = 2, do.trace=100)
tree <- getTree(model, k=1, labelVar=TRUE)
> tree
left daughter right daughter split var split point status prediction
1 2 3 Petal.Width 0.80 1 <NA>
2 0 0 <NA> 0.00 -1 setosa
3 4 5 Petal.Width 1.75 1 <NA>
4 6 7 Petal.Length 4.95 1 <NA>
5 8 9 Sepal.Width 3.15 1 <NA>
6 0 0 <NA> 0.00 -1 versicolor
7 10 11 Sepal.Width 2.45 1 <NA>
8 0 0 <NA> 0.00 -1 virginica
9 12 13 Sepal.Length 6.10 1 <NA>
10 0 0 <NA> 0.00 -1 virginica
11 14 15 Sepal.Length 6.15 1 <NA>
12 0 0 <NA> 0.00 -1 versicolor
13 0 0 <NA> 0.00 -1 virginica
14 0 0 <NA> 0.00 -1 versicolor
15 16 17 Sepal.Width 2.90 1 <NA>
16 0 0 <NA> 0.00 -1 virginica
17 18 19 Petal.Width 1.65 1 <NA>
18 0 0 <NA> 0.00 -1 virginica
19 0 0 <NA> 0.00 -1 versicolor
我想提取每个终端节点(其中tree$status = -1
)中的所有记录,并在每个终端节点上运行以记录naiveBayes模型(或任何其他模型)。