我有这些数据(实际上它包含数千行和更多名称/类):
A 0.5 0.2 T
B 0.4 0.2 T
C 0.6 0.3 F
D 0.5 0.4 G
E 0.4 0.5 F
E 0.5 0.2 Y
A 0.1 0.2 F
R 0.3 0.3 G
W 0.7 0.1 Y
我想预测最后一栏。
我的代码:
library(caret)
library(rpart.plot)
mydata <- read.table("./test.data", dec = "\t")
mydata <- as.data.frame(mydata)
colnames(mydata) <- c("Name", "V1", "V2", "Result")
trainIndex <- createDataPartition(mydata$Result, p = 0.7, list = FALSE, times = 1)
train_data <- mydata[trainIndex, ]
test_data <- mydata[-trainIndex, ]
trctrl <- trainControl(method = "repeatedcv", repeats = 1, number = 3)
mymodel <- train(Result~., data = train_data, method = "rpart", trControl = trctrl)
rpart.plot(mymodel$finalModel)
问题是该图仅显示1个变量而不是全部变量 (当然现在问题是微不足道的,但在我真正的问题中,我有很多行和10个不同的类可供选择,它向我显示只有2个类的决策树)