如何使用Pandas数据结构来计算自相关?

时间:2013-05-10 20:03:16

标签: python numpy scipy pandas

我在文本文件中有数据已成功解析为MultiIndex pandas结构但是我不知道我所拥有的是否会按照我的意愿去做。

我所拥有的是许多具有许多标识符(索引)的时间序列数据。我最终需要计算每个时间序列的自相关时间和其他时间序列统计数据。

#!/usr/bin/python

from pandas import Series, DataFrame, MultiIndex
...
data = Series(value, index=[smear, block, obser])
print data

print data.ix[('0.07','1','0')]

这为数据结构产生如下输出:

0.07  0  0     1.5802561
         1    0.82228274
         2    0.70917131
         3    0.90707599
         4     0.8517223
         5    0.26346815
      1  0     1.8163109
         1     0.9972372
         2     1.0872181
         3     1.2459765
         4     1.1500478
         5    0.35668446
      2  0     2.0734421
         1     1.2863641
         2     1.4033583
...
0.34  2  3     1.9047537
         4     1.8193612
         5    0.77739654
      3  0     2.2757423
         1     1.5499509
         2     1.6623247
         3     1.8330889
         4     1.7484187
         5    0.72914635
      4  0     2.3269071
         1     1.7137621
         2     1.7359068
         3     1.9162268
         4     1.9714984
         5     1.2095218
Length: 32100

我感兴趣的时间序列信息存在于smear,block,obser的指定值。这里给出了一个示例:smear = 0.07,block = 1,obser = 0.最右边的列是我的时间序列数据。

0.07  1  0    1.8163109
         0    1.8191682
         0     1.816836
         0    1.8172168
         0    1.8169705
...
         0    1.8184542
         0    1.8170772
         0    1.8159326
         0    1.8161826
Length: 107

如何重塑数据,以便编写可以计算自动关联时间的函数?

1 个答案:

答案 0 :(得分:2)

首先,使用data.ix(whatever)对象的“values”组件来获取时间序列的原始数组。然后使用numpy.correlate问题的答案中描述的方法,使用this来计算自相关。