我正在努力学习出色的《统计学习入门》。 他们在其中一个实验室里写
pcr.fit<-pcr(Salary~.,data=Hitters,subset=train,scale=TRUE,validation="CV")
但这让我感到困惑。 validation =“ CV”表示它将进行10倍交叉验证。我的印象是,这意味着它将随机将其分为十组,大小大致相等,每组将轮流作为测试集。如果是这样,那为什么还要指定一个训练集呢?当您指定validation =“ CV”且该subset = train时,此方法到底在做什么?
谢谢。