所以我有一个统计学学习课的作业,我确实在这个特定问题上苦苦挣扎。它显示为“现在使用10倍交叉验证来选择最佳的次数多项式。选择了哪个次数?它与您在(b)中得出的结论相符吗?您可以考虑进行绘图以证明您的决定合理。”
concrete是数据集。我们正在尝试根据年龄预测抗压强度。
我尝试了多种方法来执行交叉验证,这是我能得到的最接近的方法:
deltas = rep(NA, 10, FALSE)
for (i in 1:7) {
cv.poly.fit = glm(concrete$Concretecompressivestrength~poly(concrete$Age, i))
deltas[i] = cv.glm(concrete$Concretecompressivestrength, cv.poly.fit, K = 10)$delta[1]
}
我们应该在1-7之间选择一个度,我用方差分析告诉我5度模型是最好的。现在我们应该使用交叉验证进行比较,看看是否得到不同的答案。
问题出在“ deltas [i]”部分,该部分不断显示以下错误消息:
Error in if ((K > n) || (K <= 1)) stop("'K' outside allowable range") :
missing value where TRUE/FALSE needed`
我真的不知道错误消息的含义或解决方法。