按时间分组和大熊猫中的其他列

时间:2016-03-09 17:34:52

标签: pandas

我有一个包含列时间戳,名称和值

的大型pandas数据帧
index    timestamp                     name   value
0        1999-12-31 23:59:59.000107    A      16
1        1999-12-31 23:59:59.000385    B      12
2        1999-12-31 23:59:59.000404    C      25 
3        1999-12-31 23:59:59.000704    B      15
4        1999-12-31 23:59:59.001281    A      300
5        1999-12-31 23:59:59.002211    C      20
6        1999-12-31 23:59:59.002367    C      3

我希望按时间分组(比如20分钟或20分钟)和名称分组,并计算每组的平均值。

最有效的方式是什么?

1 个答案:

答案 0 :(得分:3)

您可以使用pd.Grouper,但它要求您在索引上设置时间戳。所以你可以尝试类似的东西:

df.set_index('timestamp').groupby([pd.Grouper(freq='20Min'), 'name']).mean()