在解释prcomp()
的结果时遇到一些问题。
说我有一个居中且可缩放的data.table,称为dat,具有N列和M行。实际上,每一列代表一个功能,每一行代表一个记录。我还得到了结果Y
的M维向量。
我想知道该系统的PCA表示什么。所以我刚刚执行了:
dat.pca=prcomp(dat,retx=TRUE)
通过弯头法,我决定保留5种PCA模式,占90%的方差。然后,我得到了以下data.table
:
dat.pcadata=as.data.table(dat.pca$x)
dat.pcadata
具有M行N列,每列对应一个PCA模式。
我的问题是:如果我说现在应该训练我的系统以dat.pcadata
的前5列为特征来预测结果Y,我是否正确理解?