我有一个像这样的数据框'gt':
org group
org1 1
org2 1
org3 2
org4 3
org5 3
org6 3
并且我想将列'count'添加到gt数据帧以计算组成员数量,预期结果如下:
org group count
org1 1 2
org2 1 2
org3 2 1
org4 3 3
org5 3 3
org6 3 3
我知道该怎么做每个组的一个项目,但不知道如何重复所有组项目的计数,这是我使用的代码:
gtcounts = gt.groupby('group').count()
有人可以帮忙吗?
答案 0 :(得分:31)
调用transform
这将返回与原始df对齐的系列:
In [223]:
df['count'] = df.groupby('group')['group'].transform('count')
df
Out[223]:
org group count
0 org1 1 2
1 org2 1 2
2 org3 2 1
3 org4 3 3
4 org5 3 3
5 org6 3 3