尝试使用插入符号在我的数据集(HousePrice)上预测线性模型时遇到一些麻烦。当我拟合模型时就可以了,但是当我尝试进行预测以生成submitting.csv文件时,出现此错误: '''
预测<-预测(lm.fit,data.test) model.frame.default中的错误(术语,newdata,na.action = na.action,xlev = object $ xlevels): 因素Neighbourhood具有新水平Blueste '''
在这里我粘贴一些代码:
首先,从工作的数据集 new_all 中,我创建了两个分区,一个分区(没有响应变量)和一个测试分区。
data_processed_train = new_all[1:1100,]
data_processed_train = cbind(data_processed_train, train["SalePrice"])
data_processed_test = new_all[1101:dim(all)[1], ]
此后,为了更好地执行模型,我进行了验证:
set.seed(12345)
inTrain <- createDataPartition(y = data_processed_train$SalePrice, p = .7, list = FALSE)
data.train <- data_processed_train[inTrain, ]
data.test <- data_processed_train[- inTrain, ]
最后,我执行模型并进行预测。
fit.control <- caret::trainControl(method = "cv", number = 10)
lm.fit <- caret::train(SalePrice ~ .,
data = data.train,
method = "lm",
trControl = fit.control)
min(lm.fit$results$RMSE) #BEST RMSE
prediction <- predict(lm.fit,data.test)
预先感谢