为什么PCA.explained_variance_ratio_的80%似乎是一个合理的阈值?关于解释80%的方差所需的成分数量,该怎么说呢?
According to the PCA documentation,
自动:
通过基于X.shape和n_components的默认策略选择求解器:如果输入数据大于500x500,并且要提取的组件数小于数据最小维度的80%,则该数量更多启用了有效的“随机化”方法。否则,将计算出精确的完整SVD,然后选择截断。
好吧,我不确定我是否说得通,但似乎80%是一个很好的门槛,但是为什么呢?我尝试查找此内容,但数量不多。