我有一组样本(向量),每个样本的维度大约为M(10000),并且集合的大小也约为N(10000),我想找到第一个(最大的eiegenvalues)10个PC这一套。由于样本的大尺寸,我无法在合理的时间内计算出协变矩阵。是否有任何方法可以选择PC而无需计算完整的cov矩阵或可以有效处理大尺寸数据的方法或类似的东西?所以这些方法应该比O(M * M * N)需要更少的操作。
答案 0 :(得分:1)
NIPALS - 非线性迭代偏最小二乘法
答案 1 :(得分:0)
伙计们,也许它可能会有所帮助,我已经在EM-PCA方法系列中找到了解决方案(例如参见http://www.cmlab.csie.ntu.edu.tw/~cyy/learning/papers/PCA_RoweisEMPCA.pdf)