我一直在实验resampling
(60S)数据,从刻度database
到另一个称为database
的{{1}}。
我将两个数据库中的min
加载到to_excel
中。
在pandas
数据框中:
min
当然,也有很多类似上面的行,带有不同的时间戳。
我想知道如何将所有这些结合在一起,以得到只有1行的正确 timestamp open high low close
47759 2019-11-04 14:23:00 30468.00 30473.90 30440.15 30445.00
47758 2019-11-04 14:23:00 30468.00 30473.90 30440.15 30450.00
47758 2019-11-04 14:23:00 30468.00 30473.90 30440.15 30455.00
47758 2019-11-04 14:23:00 30468.00 30473.90 30440.15 30460.00
47758 2019-11-04 14:23:00 30468.00 30479.00 30440.15 30479.00
。
该过程不会很耗时,因为必须进行信号处理。
TIA
答案 0 :(得分:1)
您可以使用T
并在初始.agg
之后传递带有预期聚合指标的列字典
groupby
如果您不想忽略时间而只关注日期,则可以这样做
print(df)
timestamp open high low close
0 2019-11-04 14:23:00 30468 30473.9 30440.15 30445
1 2019-11-04 14:23:00 30468 30473.9 30440.15 30450
2 2019-11-04 14:23:00 30468 30473.9 30440.15 30455
3 2019-11-04 14:23:00 30468 30473.9 30440.15 30460
4 2019-11-04 14:23:00 30468 30479.0 30440.15 30479
df1 = df.groupby(df['timestamp']).agg
({'open' : 'first', 'high' : 'max', 'low' : 'min', 'close' : 'last'})
print(df1)
open high low close
timestamp
2019-11-04 14:23:00 30468 30479.0 30440.15 30479