标签: python machine-learning pca prediction
从非常一般的角度来看,当你有一个数据集X并且想要预测标签Y时,首先开始使用PCA(主成分分析),然后自己进行预测(具有后勤)的目的是什么从直觉和理论上的原因回归,或随机森林或其他什么?在哪种情况下,这可以提高预测质量? 谢谢!
答案 0 :(得分:0)
我认为你的意思是基于PCA的降维。低差异数据通常(但并非总是如此)几乎没有预测能力,因此删除数据集的低方差维度可以成为改善预测变量运行时间的有效方法。在提高信噪比的情况下,它甚至可以提高预测质量。但这只是一种启发式方法,并不普遍适用。