这是我的数据集
customer_id hour size
1 0 1
1 1 18
2 1 7
这是我的代码
table = a.pivot_table(index=['customer_id'],
columns='hour',
fill_value=0,
values='size')
这就是我所拥有的
hour 0 1
customer_id
1 1 18
2 8 7
我需要什么
hour 0 1 count sum
customer_id
1 1 18 2 19
2 0 7 1 7
count 1 2
sum 1 25
count
在non-zero count
类别中,sum
是类别中的总和
答案 0 :(得分:3)
一种可能的动态解决方案是省略fill_value=0
:
table = a.pivot_table(index='customer_id',
columns='hour',
values='size')
print (table)
hour 0 1
customer_id
1 1.0 18.0
2 NaN 7.0
a = table.agg(['count','sum'])
b = table.T.agg(['count','sum']).T
print (table.fillna(0).append(a).join(b))
0 1 count sum
1 1.0 18.0 2.0 19.0
2 0.0 7.0 1.0 7.0
count 1.0 2.0 NaN NaN
sum 1.0 25.0 NaN NaN