减少大数据集

时间:2019-02-10 03:22:25

标签: r

我有大约1万个数据的大型数据集。所以我想减少数据集。我将使用主成分分析(PCA)作为降维方法。我的数据集由二进制位组成。

我设法通过使用prcomp函数来使用PCA。但是,我有一些问题(通过使用cut off函数)来切断数据。

install.packages("FSelector")    
library("FSelector")    
data<-f2    
weight <- prcomp(data, scale = FALSE)    
weight    
subset <- cutoff.k(weight, 100)    
subset    
f <- as.simple.formula(subset, "Class")    
f    
newdata <-  data.frame(data[,cutoff.k(weight, 100)])    
newdata  

我希望数据集会小于实际数据集。

谢谢。

0 个答案:

没有答案