我有大约1万个数据的大型数据集。所以我想减少数据集。我将使用主成分分析(PCA)作为降维方法。我的数据集由二进制位组成。
我设法通过使用prcomp函数来使用PCA。但是,我有一些问题(通过使用cut off函数)来切断数据。
install.packages("FSelector")
library("FSelector")
data<-f2
weight <- prcomp(data, scale = FALSE)
weight
subset <- cutoff.k(weight, 100)
subset
f <- as.simple.formula(subset, "Class")
f
newdata <- data.frame(data[,cutoff.k(weight, 100)])
newdata
我希望数据集会小于实际数据集。
谢谢。