如何在数据透视表上添加总和和计数

时间:2018-06-08 08:47:29

标签: python pandas dataframe pivot-table

这是我的数据集

customer_id hour    size
1              0       1
1              1      18
2              1       7

这是我的代码

table = a.pivot_table(index=['customer_id'], 
                      columns='hour', 
                      fill_value=0,
                      values='size')

这就是我所拥有的

hour            0   1
customer_id       
1               1  18
2               8   7

我需要什么

hour            0   1   count  sum
customer_id       
1               1  18       2   19
2               0   7       1    7
count           1   2
sum             1  25

countnon-zero count类别中,sum是类别中的总和

1 个答案:

答案 0 :(得分:3)

一种可能的动态解决方案是省略fill_value=0

table = a.pivot_table(index='customer_id', 
                      columns='hour', 
                      values='size')
print (table)
hour           0     1
customer_id           
1            1.0  18.0
2            NaN   7.0

a = table.agg(['count','sum'])
b = table.T.agg(['count','sum']).T

print (table.fillna(0).append(a).join(b))
         0     1  count   sum
1      1.0  18.0    2.0  19.0
2      0.0   7.0    1.0   7.0
count  1.0   2.0    NaN   NaN
sum    1.0  25.0    NaN   NaN