Pandas .groupby自动选择列

时间:2016-05-02 12:48:31

标签: python pandas

从以下数据集中: enter image description here

我正在尝试使用.groupby来创建一个集合,其中我获得每个用户位置的平均状态计数。我已经使用

为Follower Count做了这个
groupLoc = df.groupby('User Location')
groupCount = groupLoc.mean()
groupCount

自动选择用户位置与关注者计数。现在我正在尝试对用户位置和状态计数执行相同操作,但它会自动再次包括跟随者计数。

enter image description here

任何人都知道如何解决这个问题?提前谢谢!

1 个答案:

答案 0 :(得分:1)

我认为groupby需要mean

print df.groupby('User Location', as_index=False)['Follower Count'].mean()
     User Location  Follower Count
0           Canada     1654.500000
1          Chicago     9021.000000
2        Indonesia     1352.666667
3           London      990.000000
4   Los Angeles CA       86.000000
5         New York      214.000000
6        Singapore      106.500000
7            Texas      181.000000
8               UK     2431.000000
9        indonesia      316.000000
10            null      295.750000

print df.groupby('User Location', as_index=False)['Status Count'].mean()
     User Location  Status Count
0           Canada  39299.000000
1          Chicago   6402.000000
2        Indonesia  12826.000000
3           London   4864.666667
4   Los Angeles CA   3230.000000
5         New York   2947.000000
6        Singapore   6785.500000
7            Texas    901.000000
8               UK  81440.000000
9        indonesia  17662.000000
10            null  29610.875000