尝试执行交叉验证以找到多项式的最佳度

时间:2018-10-29 22:17:15

标签: r statistics

所以我有一个统计学学习课的作业,我确实在这个特定问题上苦苦挣扎。它显示为“现在使用10倍交叉验证来选择最佳的次数多项式。选择了哪个次数?它与您在(b)中得出的结论相符吗?您可以考虑进行绘图以证明您的决定合理。”

concrete是数据集。我们正在尝试根据年龄预测抗压强度。

我尝试了多种方法来执行交叉验证,这是我能得到的最接近的方法:

deltas = rep(NA, 10, FALSE)
for (i in 1:7) {
  cv.poly.fit = glm(concrete$Concretecompressivestrength~poly(concrete$Age, i))
  deltas[i] = cv.glm(concrete$Concretecompressivestrength, cv.poly.fit, K = 10)$delta[1]
}

我们应该在1-7之间选择一个度,我用方差分析告诉我5度模型是最好的。现在我们应该使用交叉验证进行比较,看看是否得到不同的答案。

问题出在“ deltas [i]”部分,该部分不断显示以下错误消息:

Error in if ((K > n) || (K <= 1)) stop("'K' outside allowable range") : 
missing value where TRUE/FALSE needed`

我真的不知道错误消息的含义或解决方法。

0 个答案:

没有答案