假设我有这个时间序列数据:
A B
timestamp
1 1 2
2 1 2
3 1 1
4 0 1
5 1 0
6 0 1
7 1 0
8 1 1
我正在寻找一个重新采样值,它会给出我至少某些频率的具体发生次数
如果我将重新采样用于2到1的数据,那么如果我从2到8开始相同的窗口大小(2S),我会得到不同的最大值
ds = series.resample( str(tries) +'S').sum()
for shift in range(1,100):
tries = 1
series = pd.read_csv("file.csv",index_col='timestamp') [shift:]
ds = series.resample( str(tries) +'S').sum()
while ( (ds.A.max + ds.B.max < 4) & (tries < len(ds))):
ds = series.resample( str(tries) +'S').sum()
tries = tries + 1
#other lines
我正在寻找性能改进,因为大数据需要花费很长时间才能完成