基尼的变量重要性/平均值减少如何> .5?

时间:2017-06-28 15:01:14

标签: r random-forest gini

我目前正在开展一个使用Random Forest的项目。我想知道所有协变量的特征重要性,并希望使用MeanDecreaseGini

我真的不明白为什么可能有大于0.5的值。基尼指数不能大于0.5,因此减少也不应该。当您对使用特定协变量的林中节点中的所有值进行平均时,Gini的平均减少量不能大于0.5。任何人都可以说,我的思维错误在哪里?

以下是代码的示例,其中MeanDecreaseGini的结果远大于0.5:

install.packages("randomForest")
library(randomForest)

set.seed(1)
a <- as.factor(c(rep(1, 20), rep(0, 30)))
b <- c(rnorm(20, 5, 2), rnorm(30, 4, 1))
c <- c(rnorm(25, 0, 1), rnorm(25, 1, 2))
data <- data.frame(a = a, b = b, c = c)

rf <- randomForest(data = data, a ~ b + c, importance = T, ntree = 300)
importance(rf)

0 个答案:

没有答案