我需要在R中执行主成分逻辑回归,使用交叉验证自动选择已使用成分的数量。
我希望这已经在R中得到了充分的实现,但是我没有完全找到我要寻找的东西。这边提到的过程非常接近:https://www.r-bloggers.com/performing-principal-components-regression-pcr-in-r/,但是我对此方法有一些疑问:
此外,在执行此代码时,我遇到了存储问题(请参见下面的示例):虽然PCA和数据的PCA投影训练(虽然在下面的示例中没有收敛)都可以单独进行,但是由于以下原因,以下代码无法执行:内存问题,我不知道为什么:
library("pls")
n <- 200
m <- 50000
set.seed(42)
X <- matrix(rnorm(n*m), nrow=n)
Y <- as.integer(sample(c(0,1), replace=TRUE, size=n))
data <- data.frame(cbind(X, Y))
pcr_model <- pcr(Y~., data=data, scale=TRUE, validation="CV") #not possible
我想知道上面代码中的pcr(...)行是否存在替代/调整,它没有任何存储问题,允许使用逻辑回归模型并选择交叉使用的度量-验证。 (我可以自己执行该过程,但希望使用内置函数为我完成该过程。)