我有一个包含列时间戳,名称和值
的大型pandas数据帧index timestamp name value
0 1999-12-31 23:59:59.000107 A 16
1 1999-12-31 23:59:59.000385 B 12
2 1999-12-31 23:59:59.000404 C 25
3 1999-12-31 23:59:59.000704 B 15
4 1999-12-31 23:59:59.001281 A 300
5 1999-12-31 23:59:59.002211 C 20
6 1999-12-31 23:59:59.002367 C 3
我希望按时间分组(比如20分钟或20分钟)和名称分组,并计算每组的平均值。
最有效的方式是什么?
答案 0 :(得分:3)
您可以使用pd.Grouper
,但它要求您在索引上设置时间戳。所以你可以尝试类似的东西:
df.set_index('timestamp').groupby([pd.Grouper(freq='20Min'), 'name']).mean()