model.frame.default()因数中的错误邻域具有新级别blueste

时间:2019-12-13 15:15:58

标签: r data-science

尝试使用插入符号在我的数据集(HousePrice)上预测线性模型时遇到一些麻烦。当我拟合模型时就可以了,但是当我尝试进行预测以生成submitting.csv文件时,出现此错误: '''

  

预测<-预测(lm.fit,data.test)   model.frame.default中的错误(术语,newdata,na.action = na.action,xlev = object $ xlevels):     因素Neighbourhood具有新水平Blueste   '''

在这里我粘贴一些代码:

首先,从工作的数据集 new_all 中,我创建了两个分区,一个分区(没有响应变量)和一个测试分区。

data_processed_train = new_all[1:1100,]
data_processed_train = cbind(data_processed_train, train["SalePrice"])
data_processed_test = new_all[1101:dim(all)[1], ]

此后,为了更好地执行模型,我进行了验证:

set.seed(12345)
inTrain <- createDataPartition(y = data_processed_train$SalePrice, p = .7, list = FALSE)

data.train <- data_processed_train[inTrain, ]
data.test <- data_processed_train[- inTrain, ]

最后,我执行模型并进行预测。

fit.control <- caret::trainControl(method = "cv", number = 10)

lm.fit <- caret::train(SalePrice ~ .,
                       data = data.train,
                       method = "lm",
                       trControl = fit.control)

min(lm.fit$results$RMSE) #BEST RMSE 
prediction <- predict(lm.fit,data.test)

预先感谢

0 个答案:

没有答案