保证金为熊猫提供错误输出

时间:2017-05-05 10:13:42

标签: python pandas

我正在使用pandas创建带边距的数据透视表。

示例csv文件

col1,col2,col3
a,1,z
a,2,z
c,1,x
c,4,x
b,5,y
b,1,y

我使用pandas 0.13.1创建了一个数据透视表。我为每列获得了正确的数字,但是边距的数字错误。

import pandas
import numpy
import re
import math
data = pandas.read_csv('abc.csv');
pivot = pandas.pivot_table(data,values='col1', rows='col2', cols='col3', aggfunc=numpy.count_nonzero, margins=True)
print(pivot)

我得到的输出是

col3   x   y   z  All
col2                 
1      1   1   1    6
2    NaN NaN   1    2
4      1 NaN NaN    2
5    NaN   1 NaN    2
All    4   4   4    6

请注意,所有列和所有行中的计数都是错误的。代码中的错误是什么?如何获得写入总和?

0 个答案:

没有答案