我想计算熊猫数据帧中子集的出现

时间:2021-06-03 16:41:03

标签: python pandas

如果在数据框中我有如下数据:

Name   Id
Alex   123
John   222
Alex   123
Kendal 333

所以我想添加一个将导致的列:

Name   Id  Subset Count
Alex   123    2
John   222    1
Alex   123    2
Kendal 333    1

我使用了下面的代码,但没有得到输出:

df['Subset Count'] = df.value_counts(subset=['Name','Id'])

1 个答案:

答案 0 :(得分:2)

通过 groupby() 尝试:

df['Subset Count']=df.groupby(['Name','Id'])['Name'].transform('count')

通过 droplevel()map()

df['Subset Count']=df['Name'].map(df.value_counts(subset=['Name','Id']).droplevel(1))
相关问题