我正在使用pandas创建带边距的数据透视表。
示例csv文件
col1,col2,col3
a,1,z
a,2,z
c,1,x
c,4,x
b,5,y
b,1,y
我使用pandas 0.13.1创建了一个数据透视表。我为每列获得了正确的数字,但是边距的数字错误。
import pandas
import numpy
import re
import math
data = pandas.read_csv('abc.csv');
pivot = pandas.pivot_table(data,values='col1', rows='col2', cols='col3', aggfunc=numpy.count_nonzero, margins=True)
print(pivot)
我得到的输出是
col3 x y z All
col2
1 1 1 1 6
2 NaN NaN 1 2
4 1 NaN NaN 2
5 NaN 1 NaN 2
All 4 4 4 6
请注意,所有列和所有行中的计数都是错误的。代码中的错误是什么?如何获得写入总和?