说一个拥有执行PCA的程序。 该程序计算必要的PC数量,以覆盖数据中全部变化的给定份额,例如95%。
假设在t = 1时使用的数据要覆盖95%的方差所需的PC数为10。
在t = 2时,我们使用t = 2的数据重新运行程序。 对于t = 2,要覆盖95%的方差所需的PC数是5。
因此,为了覆盖95%的方差所需的PC数量已从t = 1到t = 2从10减少到了5。
主要问题:
在这种情况下,我们可以对数据从t = 1到t = 2的变化做出任何结论吗?
示例:
我们可以这样说吗:“由于PC数量从t = 1减少到t = 2,所以t = 1时数据的相关性比t = 2时大。需要PC来覆盖数据中给定份额的变化。”
答案 0 :(得分:0)
是的,如果原始变量之间具有很强的相关性,则减少的分量数量可以解释80%至90%的方差,并且方差百分比对应于数据中信息的百分比,该百分比已由个人电脑。此外,如果您想了解有关PCA的更多详细信息,可以阅读以下很棒的评论:https://stats.stackexchange.com/questions/2691/making-sense-of-principal-component-analysis-eigenvectors-eigenvalues/140579#140579