PCA方差比的80%阈值有何特别之处?

时间:2018-11-18 15:34:38

标签: python pca

为什么PCA.explained_variance_ratio_的80%似乎是一个合理的阈值?关于解释80%的方差所需的成分数量,该怎么说呢?

According to the PCA documentation

  

自动:

     

通过基于X.shape和n_components的默认策略选择求解器:如果输入数据大于500x500,并且要提取的组件数小于数据最小维度的80%,则该数量更多启用了有效的“随机化”方法。否则,将计算出精确的完整SVD,然后选择截断。

好吧,我不确定我是否说得通,但似乎80%是一个很好的门槛,但是为什么呢?我尝试查找此内容,但数量不多。

0 个答案:

没有答案