通过时间序列数据中的重新采样进行移位

时间:2017-07-26 13:58:44

标签: python-2.7 time-series bigdata

假设我有这个时间序列数据:

                        A   B
timestamp       
1                       1   2
2                       1   2
3                       1   1
4                       0   1
5                       1   0
6                       0   1
7                       1   0
8                       1   1

我正在寻找一个重新采样值,它会给出我至少某些频率的具体发生次数

如果我将重新采样用于2到1的数据,那么如果我从2到8开始相同的窗口大小(2S),我会得到不同的最大值

ds = series.resample( str(tries) +'S').sum()
for shift in range(1,100):
    tries = 1
    series = pd.read_csv("file.csv",index_col='timestamp') [shift:]
    ds = series.resample( str(tries) +'S').sum()
    while ( (ds.A.max + ds.B.max < 4) & (tries < len(ds))):
        ds = series.resample( str(tries) +'S').sum()
        tries = tries + 1
        #other lines

我正在寻找性能改进,因为大数据需要花费很长时间才能完成

0 个答案:

没有答案