我正在尝试构建一个随机森林,但无论我如何努力处理NA并重新构建我的数据,我都会继续犯同样的错误,因为这似乎是导致此错误的最常见原因。但它仍然存在,我无法运行我的模型。
##Prepare data for random forest
Comprr<-Compr
Comprr$Mudster<-ifelse(Comprr$verifikation <10,'good','ok')
Comprr$Mudster[Comprr$verifikation==10]<-'restricted'
Comprr$Mudster<-as.factor(Comprr$Mudster)
table(Comprr$Mudster)
##Separate test and train data
set.seed(123)
samp<-sample(nrow(Comprr),0.6 * nrow(Comprr))
train<-Comprr[samp, ]
test<-Comprr[-samp, ]
na.roughfix(Comprr)
##Building the model
library(randomForest)
model<-randomForest(Comprr$Mudster~ . -verifikation,data = train)
这是代码的相关部分,这是它返回的错误消息
Error in model.frame.default(formula = Mudster ~ . - verifikation, data = train, :
variable lengths differ (found for 'message'
) 而且无论我在每次返回错误时都尝试逐一清理变量,直到我意识到它更基本的东西。 非常感谢您的帮助! 提前致谢
答案 0 :(得分:0)
尝试在RF模型行之前运行此
names(Comprr)<-make.names(names(Comprr))