rev_id worker_id label
37675 1362 1.0
37675 2408 0.0
37675 1493 0.0
37675 1439 1.0
37675 170 0.0
37675 176 0.0
37675 481 1.0
37675 487 0.0
37675 578 0.0
以下是数据框的段落,我想按rev_id分组,label
的值计数,标签只有两个值:1& 0.新数据框应该有两个新列,即每个rev_id的label = 1和label = 0的计数。
如何实现它?
答案 0 :(得分:1)
我认为您需要groupby
+ value_counts
,并按unstack
重新整形:
df = df.groupby('rev_id')['label'].value_counts().unstack()
两列的或groupby
并使用size
:
df = df.groupby(['rev_id', 'label']).size().unstack()
print (df)
label 0.0 1.0
rev_id
37675 6 3