R: - 模型/变量长度不一致 - 随机森林

时间:2016-07-26 14:14:15

标签: r statistics random-forest

我正在尝试构建一个随机森林,但无论我如何努力处理NA并重新构建我的数据,我都会继续犯同样的错误,因为这似乎是导致此错误的最常见原因。但它仍然存在,我无法运行我的模型。

  ##Prepare data for random forest
Comprr<-Compr
Comprr$Mudster<-ifelse(Comprr$verifikation <10,'good','ok')
Comprr$Mudster[Comprr$verifikation==10]<-'restricted'
Comprr$Mudster<-as.factor(Comprr$Mudster)
table(Comprr$Mudster)

##Separate test and train data 
set.seed(123)
samp<-sample(nrow(Comprr),0.6 * nrow(Comprr))
train<-Comprr[samp, ]
test<-Comprr[-samp, ]
na.roughfix(Comprr)
##Building the model
library(randomForest)
model<-randomForest(Comprr$Mudster~ . -verifikation,data = train)

这是代码的相关部分,这是它返回的错误消息

Error in model.frame.default(formula = Mudster ~ . - verifikation, data = train,  : 
  variable lengths differ (found for 'message'

) 而且无论我在每次返回错误时都尝试逐一清理变量,直到我意识到它更基本的东西。 非常感谢您的帮助! 提前致谢

1 个答案:

答案 0 :(得分:0)

尝试在RF模型行之前运行此

names(Comprr)<-make.names(names(Comprr))