答案 0 :(得分:1)
事实上,你的两个向量长度不一样:
> length(predictedWeight)
[1] 498
> length(testingbabydata$weight)
[1] 500
原因是您的某些功能是NA,而您的预测只是省略了这些行。处理模型中缺少的数据是一个复杂的主题,但由于它只有500行中的两行,你现在可以删除它们并继续学习:
testingbabydata<-testingbabydata[complete.cases(testingbabydata),]
然后你可以计算你的RMSE(你也可以直接做,没有助手):
> sqrt(mean((testingbabydata$weight-predictedWeight)^2))
[1] 1.025823
并且您可以将其与始终预测平均值的模型进行比较:
> sqrt(mean((testingbabydata$weight-mean(testingbabydata$weight))^2))
[1] 1.460638