汇总Pandas数据框中的列数据

时间:2020-10-18 15:43:50

标签: python pandas dataframe

我有一个数据框,如下所示:

col1 = ['a','b','c','a','c','a','b','c','a']
col2 = [1,1,0,1,1,0,1,1,0]
df2 = pd.DataFrame(zip(col1,col2),columns=['name','count'])

    name    count
0   a       1
1   b       1
2   c       0
3   a       1
4   c       1
5   a       0
6   b       1
7   c       1
8   a       0

我正在尝试计算与“名称”列中每个元素相对应的0和1的数量。 因此,预期输出如下所示:

name  zero_count  one_count

a     2           2
b     0           2
c     1           2

到目前为止,我尝试了许多场景,其中一种看起来很有希望的场景是:

ser = df2.groupby(['name','count']).size().to_frame().reset_index()
ser
    name    count  0
0   a       0      2
1   a       1      2
2   b       1      2
3   c       0      1
4   c       1      2

我已经跌到了谷底。无法解决这个问题。你能帮我吗?

3 个答案:

答案 0 :(得分:4)

尝试crosstab

pd.crosstab(df2['name'], df2['count'])
Out[40]: 
count  0  1
name       
a      2  2
b      0  2
c      1  2

答案 1 :(得分:1)

单线:

custom::vector<int>::alloc::allocate(5)

逐步说明:

In [982]: df2.groupby(['name','count']).size().reset_index().pivot('name', 'count')
Out[982]: 
         0     
count    0    1
name           
a      2.0  2.0
b      NaN  2.0
c      1.0  2.0

答案 2 :(得分:1)

#count zeros:
df2.groupby(['name']).agg(lambda x: x.eq(0).sum())
#count ones:
df2.groupby(['name']).agg(lambda x: x.eq(1).sum())