我有50个向量,它们被PCA(n_components=.99)减少到5(即,由5个主成分解释了99%的方差)。
使用 模型的标准方法是将50个向量transform()
(即投影)到5:每次我想将其用于新观测时,我计算50个数字,然后将此向量投影到5个主要分量。
但是,计算这50个数字很昂贵,所以我会很多宁愿选择 5(或甚至是6个),而不是全部计算50个然后进行投影。
如何选择一些或多或少跨越主要空间的组件?
很显然,我可以找到与主向量“最共线”的向量,但是如果没有向量与特定主向量完全共线怎么办?