在R中更改决策树的训练功能

时间:2019-07-25 13:40:11

标签: r decision-tree

这是我的问题:

我有一个有关液压系统状况的中等大小的数据集。

数据集由68个变量加上系统状态(绿色,黄色,红色)表示

(谈论条件,颜色表示:红色警告,黄色注意,绿色良好)

我将使用的分类器为:

1)决策树 2)SVM线性 3)SVM径向 4)神经网络 5)朴素贝叶斯 6)随机森林。

因此,当我使用它们时,是否需要每次更改火车功能?

我必须使用几个分类器来预测系统的行为,因此我将数据集分为训练集和测试集,如下所示:

Tab$Condition=factor(Tab$Condition, labels=c("Yellow","Green","Red")) 

set.seed(32343)

reg_Control = trainControl("repeatedcv", number = 5, repeats=5, verboseIter = T, classProbs =T)

inTrain = createDataPartition(y=Tab$Condition,p=0.75, list=FALSE)

training = Tab[inTrain,]

testing = Tab[-inTrain,]

谈到决策树,我写道:


library(rpart)

treeFit=train(Condition~ ., data=training,method="rpart",trControl = reg_Control,tuneLength=10)


tFPrediction = predict(treeFit,newdata=training) 

confusionMatrix(tFPrediction, training$Condition)


#We have an accuracy of 96.63% cp = 0   ..... What does cp means in poor words??


tFPredictions = predict(treeFit,newdata=testing) 

confusionMatrix(tFPredictions, testing$Condition)

#misclassification of 16 / 550 accuracy of 97.09 %

每次更改分类器时都需要更改火车功能吗?

还是我应该留下写在这里的“ repetedcv”来做这项工作:


reg_Control = trainControl("repeatedcv", number = 5, repeats=5, verboseIter = T, classProbs =T)

抱歉,这个问题很平庸,但我是初学者!

答案会有所帮助!

谢谢

0 个答案:

没有答案