Question

rev_id  worker_id   label
37675   1362    1.0 
37675   2408    0.0 
37675   1493    0.0 
37675   1439    1.0 
37675   170     0.0 
37675   176     0.0 
37675   481     1.0 
37675   487     0.0 
37675   578     0.0

以下是数据框的段落，我想按rev_id分组，label的值计数，标签只有两个值：1＆amp; 0.新数据框应该有两个新列，即每个rev_id的label = 1和label = 0的计数。如何实现它？

Answer 1

我认为您需要groupby + value_counts，并按unstack重新整形：

df = df.groupby('rev_id')['label'].value_counts().unstack()

两列的

或groupby并使用size：

df = df.groupby(['rev_id', 'label']).size().unstack()

print (df)
label   0.0  1.0
rev_id          
37675     6    3

如何获取指定列的值计数？

1 个答案: