如何选择组件而不是投影它们?

时间:2018-12-07 18:47:53

标签: scikit-learn pca dimensionality-reduction

我有50个向量,它们被PCA(n_components=.99)减少到5(即,由5个主成分解释了99%的方差)。

使用 模型的标准方法是将50个向量transform()(即投影)到5:每次我想将其用于新观测时,我计算50个数字,然后将此向量投影到5个主要分量。

但是,计算这50个数字很昂贵,所以我会很多宁愿选择 5(或甚至是6个),而不是全部计算50个然后进行投影。

如何选择一些或多或少跨越主要空间的组件?

很显然,我可以找到与主向量“最共线”的向量,但是如果没有向量与特定主向量完全共线怎么办?

0 个答案:

没有答案