Python DataFrame中Timedelta值的聚合

时间:2017-07-21 14:03:22

标签: python dataframe aggregate-functions timedelta

我有大的DataFrame(df),如下所示:

  Acc_num date_diff
0   29  0:04:43
1   29  0:01:43
2   29  2:22:45
3   29  0:16:21
4   29  0:58:20
5   30  0:00:35
6   34  7:15:26
7   34  4:40:01
8   34  0:56:02
9   34  6:53:44
10  34  1:36:58
.....
Acc_num                    int64
date_diff        timedelta64[ns]
dtype: object

我需要计算' date_diff'每个帐号的平均值(以timedelta格式) df.date_diff.mean()正常运行。但是当我接下来尝试时:
df.groupby('Acc_num').date_diff.mean()它引发了一个例外:

"DataError: No numeric types to aggregate"

我也尝试了df.pivot_table()方法,但没有做任何事情。

有人可以帮我解决这个问题。提前谢谢!

1 个答案:

答案 0 :(得分:1)

确实存在奇怪的限制。但一个简单的解决方案是:

df.groupby('Acc_num').date_diff.agg(lambda g:g.sum()/g.count())

编辑:
如果您通过numeric_only=False

,Pandas实际上会尝试聚合非数字列
df.groupby('Acc_num').date_diff.mean(numeric_only=False)