我有一个包含10行和22411列的pandas数据帧。每行具有对应于特定时间点的数据。数据框根据时间点
编制索引 time_point = [0, 0.5, 1, 2, 4, 6, 8, 10, 12, 24]
。
我想使用以下方法计算跨列的时间平均协方差:
t = (data - data.mean())/time_point[i]
cor = (t.T.dot(t))/time_point[i]
这给了我一个内存错误。
此外,在计算时间平均协方差后,我需要对协方差进行PCA。请提出一些解决方法。
我正在考虑在pandas HDFStore中分别存储每列的共方差(对于每一列),然后将它们组合成数据帧,然后在其上进行PCA。我做得对吗?