将大熊猫数据帧与自身转置相乘时的内存错误

时间:2016-07-07 04:23:36

标签: python pandas covariance pca

我有一个包含10行和22411列的pandas数据帧。每行具有对应于特定时间点的数据。数据框根据时间点

编制索引

time_point = [0, 0.5, 1, 2, 4, 6, 8, 10, 12, 24]

我想使用以下方法计算跨列的时间平均协方差:

t = (data - data.mean())/time_point[i]
cor = (t.T.dot(t))/time_point[i]

这给了我一个内存错误。

此外,在计算时间平均协方差后,我需要对协方差进行PCA。请提出一些解决方法。

我正在考虑在pandas HDFStore中分别存储每列的共方差(对于每一列),然后将它们组合成数据帧,然后在其上进行PCA。我做得对吗?

0 个答案:

没有答案