Python pandas:在我的数据框中添加一个对变量进行计数的列

时间:2015-04-22 08:28:33

标签: python pandas count group-by

我有一个像这样的数据框'gt':

org     group
org1      1
org2      1
org3      2
org4      3
org5      3
org6      3

并且我想将列'count'添加到gt数据帧以计算组成员数量,预期结果如下:

org     group   count
org1      1       2
org2      1       2
org3      2       1
org4      3       3
org5      3       3
org6      3       3

我知道该怎么做每个组的一个项目,但不知道如何重复所有组项目的计数,这是我使用的代码:

gtcounts = gt.groupby('group').count()

有人可以帮忙吗?

1 个答案:

答案 0 :(得分:31)

调用transform这将返回与原始df对齐的系列:

In [223]:

df['count'] = df.groupby('group')['group'].transform('count')
df
Out[223]:
    org  group  count
0  org1      1      2
1  org2      1      2
2  org3      2      1
3  org4      3      3
4  org5      3      3
5  org6      3      3