如何获取指定列的值计数?

时间:2018-01-18 08:01:28

标签: python pandas

rev_id  worker_id   label
37675   1362    1.0 
37675   2408    0.0 
37675   1493    0.0 
37675   1439    1.0 
37675   170     0.0 
37675   176     0.0 
37675   481     1.0 
37675   487     0.0 
37675   578     0.0

以下是数据框的段落,我想按rev_id分组,label的值计数,标签只有两个值:1& 0.新数据框应该有两个新列,即每个rev_id的label = 1和label = 0的计数。 如何实现它?

1 个答案:

答案 0 :(得分:1)

我认为您需要groupby + value_counts,并按unstack重新整形:

df = df.groupby('rev_id')['label'].value_counts().unstack()
两列的

groupby并使用size

df = df.groupby(['rev_id', 'label']).size().unstack()

print (df)
label   0.0  1.0
rev_id          
37675     6    3