如何在随机森林中获取节点数?

时间:2015-05-23 22:23:18

标签: r machine-learning random-forest

在随机森林中有没有办法我可以得到我随机森林中所有树上每个节点的类计数总和?我们的想法是确定我的预测变量(哪些都是绝对的)在预测中最重要。我知道R中的重要性()函数在确定变量的重要性时已经做了,但我想确定哪些级别的预测变量是最重要的。例如,请考虑以下情形:

  • 响应变量:单击= 1,单击0
  • 自变量:类型:嬉皮士,雅皮,老人,年轻人

有什么方法可以让我了解哪些类型的人最有可能使用随机森林点击广告(点击= 1)?这是否可以使用R中的randomForest包?很容易看到一个决策树(ala CART)并查看节点计数,但是如果在一组决策树(如随机森林)的集合中如何执行此操作?

#get variable importance
    rf1 <-randomForest(trainset[,5]~.,data=trainset[,-5], mtry=bestmtry, ntree=1000, 
         keep.forest=TRUE, importance=TRUE)
    importance(rf1)
    varImpPlot(rf1)

CART:可视化节点

# Classification Tree with rpart
library(rpart)

    # grow tree
    fit <- rpart(Kyphosis ~ Age + Number + Start,
       method="class", data=kyphosis)

    # plot tree
    plot(fit, uniform=TRUE,
       main="Classification Tree for Kyphosis")
    text(fit, use.n=TRUE, all=TRUE, cex=.8)

0 个答案:

没有答案