我有一个公司名称为[青蛙,鸡,鹅]的数据框
我想根据组出现的次数创建一个名为“组号”的列。有关示例,请参见test_df。
在我以前根据邮政编码和公司名称进行分组时。但是有时我会得到不正确的计数,以及下面使用的公式示例。
df['Group'] = (df.groupby(['ZIP Code','New Home Factor']).cumcount()==0).astype(int)
test_data=({'Company Name':['Frog','Chicken','Goose','Frog','Chicken','Goose'],'Group':[1,1,1,2,2,2]})
test_df=pd.DataFrame(test_data)