R-Cran决策树

时间:2013-10-18 14:49:34

标签: r decision-tree cran

我正在尝试使用R-cran中的树包。我正在加载我的csv文件,如下所示:

data <- read.csv("C:/data2.csv", header = FALSE, sep = ";",dec = ".")

文件中的最后一列代表类这是正确的吗?

我的问题是该类应该在文件的第一列还是las列中表示谢谢。

   V1        V2     V3    V4      V5           CLASS
'X0000002'  NULL    0   NULL    'BETA'          1
'Y0034195'  NULL    2   NULL    'INTERNAL'      1
'X0000001'  NULL    0   NULL    'BETA'          2
'X0000002'  NULL    0   NULL    'BETA'          2
'X0000002'  NULL    0   NULL    'BETA'          2
'Y0034195'  NULL    0   NULL    'INTERNAL'      2

CORRECTION 好的我有24个描述符V1 ... V24。 V24是班级。我在R Cran中使用了Rpart库

library(rpart)
data <- read.csv("C:/data2.csv", header = FALSE, sep = ";",dec = ".")
d1-> data[,1:24]
fit <- rpart(v24~ v1+v2+v3+v4+v5+v6+v7+v8+v9+v10+v11+v12+v13+v14+v15+v16+v17+v18+v19+V20+v21+v22+v23,data=d1)

我收到以下错误无法找到对象'V24'

示例:解决方案

# Regression Tree Example
library(rpart)
data <- read.csv("C:/data2.csv", header = T,sep=";")
fit = rpart(linkId ~ .,method  = "anova",data  = data)

printcp(fit) # display the results 
plotcp(fit) # visualize cross-validation results 
summary(fit) # detailed summary of splits

# create additional plots 
par(mfrow=c(1,2)) # two plots on one page 
rsq.rpart(fit) # visualize cross-validation results     

# plot tree 
plot(fit, uniform=FALSE, 
     main="Regression Tree for Mileage ",compress = TRUE )
text(fit, use.n=TRUE, all=TRUE, cex=.8)

# create attractive postcript plot of tree 
post(fit, file = "c:/tree2.ps", 
     title = "Arbre de Regression ")

1 个答案:

答案 0 :(得分:1)

使用?formula查看帮助,您应该可以轻松掌握基础知识。

您的数据框中需要名称,否则R无法理解公式。此外,您可以使用快捷方式使用所有变量:

fit = rpart(CLASS ~ ., data = data)

或者

fit = rpart(data = data, formula = CLASS ~ .)

如果你对参数使用不同的顺序,你应该命名它们(不需要使用第二种方式)。