我在文本文件中有数据已成功解析为MultiIndex pandas结构但是我不知道我所拥有的是否会按照我的意愿去做。
我所拥有的是许多具有许多标识符(索引)的时间序列数据。我最终需要计算每个时间序列的自相关时间和其他时间序列统计数据。
#!/usr/bin/python
from pandas import Series, DataFrame, MultiIndex
...
data = Series(value, index=[smear, block, obser])
print data
print data.ix[('0.07','1','0')]
这为数据结构产生如下输出:
0.07 0 0 1.5802561
1 0.82228274
2 0.70917131
3 0.90707599
4 0.8517223
5 0.26346815
1 0 1.8163109
1 0.9972372
2 1.0872181
3 1.2459765
4 1.1500478
5 0.35668446
2 0 2.0734421
1 1.2863641
2 1.4033583
...
0.34 2 3 1.9047537
4 1.8193612
5 0.77739654
3 0 2.2757423
1 1.5499509
2 1.6623247
3 1.8330889
4 1.7484187
5 0.72914635
4 0 2.3269071
1 1.7137621
2 1.7359068
3 1.9162268
4 1.9714984
5 1.2095218
Length: 32100
我感兴趣的时间序列信息存在于smear,block,obser的指定值。这里给出了一个示例:smear = 0.07,block = 1,obser = 0.最右边的列是我的时间序列数据。
0.07 1 0 1.8163109
0 1.8191682
0 1.816836
0 1.8172168
0 1.8169705
...
0 1.8184542
0 1.8170772
0 1.8159326
0 1.8161826
Length: 107
如何重塑数据,以便编写可以计算自动关联时间的函数?
答案 0 :(得分:2)
首先,使用data.ix(whatever)
对象的“values”组件来获取时间序列的原始数组。然后使用numpy.correlate
问题的答案中描述的方法,使用this来计算自相关。