我正在尝试使用.groupby来创建一个集合,其中我获得每个用户位置的平均状态计数。我已经使用
为Follower Count做了这个groupLoc = df.groupby('User Location')
groupCount = groupLoc.mean()
groupCount
自动选择用户位置与关注者计数。现在我正在尝试对用户位置和状态计数执行相同操作,但它会自动再次包括跟随者计数。
任何人都知道如何解决这个问题?提前谢谢!
答案 0 :(得分:1)
print df.groupby('User Location', as_index=False)['Follower Count'].mean()
User Location Follower Count
0 Canada 1654.500000
1 Chicago 9021.000000
2 Indonesia 1352.666667
3 London 990.000000
4 Los Angeles CA 86.000000
5 New York 214.000000
6 Singapore 106.500000
7 Texas 181.000000
8 UK 2431.000000
9 indonesia 316.000000
10 null 295.750000
print df.groupby('User Location', as_index=False)['Status Count'].mean()
User Location Status Count
0 Canada 39299.000000
1 Chicago 6402.000000
2 Indonesia 12826.000000
3 London 4864.666667
4 Los Angeles CA 3230.000000
5 New York 2947.000000
6 Singapore 6785.500000
7 Texas 901.000000
8 UK 81440.000000
9 indonesia 17662.000000
10 null 29610.875000