我的分组数据如下:
deviceid time
01691cbb94f16f737e4c83eca8e5f5e5390c2801 January 10
022009f075929be71975ce70db19cd47780b112f April 566
August 210
January 4
July 578
June 1048
May 1483
02bad1cdf92fbaa9327a65babc1c081e59fbf435 November 309
October 54
最后一列代表计数。我使用表达式
获得了这个分组表示data1.groupby(['deviceid', 'time'])
如何获得每个设备ID的平均值,即所有月份的计数总和除以月数?我的输出应该如下:
deviceid mean
01691cbb94f16f737e4c83eca8e5f5e5390c2801 10
022009f075929be71975ce70db19cd47780b112f 777.8
02bad1cdf92fbaa9327a65babc1c081e59fbf435 181.5
答案 0 :(得分:3)
您可以使用mean
方法指定级别:
s.mean(level=0) # or: s.mean(level='deviceid')
这相当于按指数的第一级分组并取每组的平均值:s.groupby(level=0).mean()