可能重复:
PCA Analysis with Python
我有data,其尺寸为1940 x 4。它的行是读数或样本,而其列是变量(温度,湿度,风速和压力)。我想进行PCA分析并使用Python绘制结果。情况是,我最终得到了一些技巧和例子,但我不知道如何利用它们以及即使我得到PCA结果该怎么做。所以,在这里,我正在寻找一个代码示例,通过该示例我可以在这种数据集上实现Python中的PCA分析,以及了解如何解释PCA结果以及如何绘制它们。最后,如何解释这些图。非常感谢。
答案 0 :(得分:0)
主成分分析对于减少数据集的维度非常有用。由于您的数据只包含四个变量,并且(据我所知)它们没有相关性,我不希望PCA对任何实际分析都有价值。
如果我错了,并且您真诚地期望某些变量是相关的,您可以使用PCA来识别捕获大多数典型协方差的最重要的4向量。这些是协方差矩阵的特征向量。它需要四个这样的向量来完全跨越与输入变量相同的空间。
在测量大量变量并且存在大量异常信息的系统中,PCA识别独立信息的重要位。我不认为你的系统就是这种情况。