我正在尝试使用rpart绘制分类树,而R不包括我的所有变量。我有20个案例和200个变量。我的数据看起来像这样:
data <- data.frame(y = c(rep(0, 10), rep(1, 10)), x1 = c(rnorm(20)), x2 = c(rnorm(20)+0.5), x3 = c(rnorm(20)-0.2))
但是x1 + x2 + x3 .... + x200。
我的所有变量值都与此类似;非常小,有些甚至平均大约0.0005。我需要一个分类树,我的y是二进制的,所以我想要method =“class”:
cart <- rpart(formula = y ~ ., data = data, method = "class")
当我输入
print(cart)
我明白了:
n= 20
node), split, n, deviance, yval
* denotes terminal node
1) root 20 5.958333 0.4583333
2) x50< 0.0005126315 16 2.437500 0.1875000 *
3) x50>=0.0005126315 8 0.000000 1.0000000 *
我不确定为什么它只根据x50分裂。我试着用它来绘制,看看发生了什么,当我做了
plot(cart)
我得到了以下情节:http://i.imgur.com/cCTa69a.png
知道发生了什么,或者我如何解决这个问题?非常感激。