如何使用python对列值求和

时间:2012-03-28 08:29:46

标签: python sum

我有一个看起来像这样的行集:

defaultdict(<type 'dict'>, 
{
   u'row1': {u'column1': 33, u'column2': 55, u'column3': 23}, 
   u'row2': {u'column1': 32, u'column2': 32, u'column3': 17}, 
   u'row3': {u'column1': 31, u'column2': 87, u'column3': 18}
})

我希望能够轻松获得column1,column2,column3的总和。如果我可以为任意数量的列执行此操作,将结果显示在类似columnName => columnSum的哈希映射中,那将会很棒。正如您可能猜到的那样,我不可能首先从数据库中获取求和值,因此提出问题的原因。

4 个答案:

答案 0 :(得分:7)

>>> from collections import defaultdict
>>> x = defaultdict(dict, 
    {
        u'row1': {u'column1': 33, u'column2': 55, u'column3': 23}, 
        u'row2': {u'column1': 32, u'column2': 32, u'column3': 17}, 
        u'row3': {u'column1': 31, u'column2': 87, u'column3': 18}
    }) 

>>> sums = defaultdict(int)
>>> for row in x.itervalues():
        for column, val in row.iteritems():
            sums[column] += val


>>> sums
defaultdict(<type 'int'>, {u'column1': 96, u'column3': 58, u'column2': 174})

哦,这是一个更好的方式!

>>> from collections import Counter
>>> sums = Counter()
>>> for row in x.values():
        sums.update(row)


>>> sums
Counter({u'column2': 174, u'column1': 96, u'column3': 58}) 

答案 1 :(得分:2)

嵌套生成器+列表理解可以解决问题:

>>> foo
defaultdict(<type 'dict'>, {u'row1': {u'column1': 33, u'column3': 23, u'column2': 55}, u'row2': {u'column1': 32, u'column3': 17, u'column2': 32}, u'row3': {u'column1': 31, u'column3': 18, u'column2': 87}})
>>> dict(zip(foo.values()[0].keys(), [sum(j[k] for j in (i.values() for _,i in foo.items())) for k in range(3)]))
{u'column1': 96, u'column3': 58, u'column2': 174}

答案 2 :(得分:0)

不是最pythonic但是在这里:

for val in defaultdict.values() :
   sum1 += val['column1']
   sum2 += val['column2']
   sum3 += val['column3']
final_dict = {'column1' : sum1,'column2' : sum2,'column3' : sum3 }

答案 3 :(得分:0)

如果我可以建议解决方案,这是另一个答案。首先将您的数据放入Matrix。然后,将矩阵乘以1的向量。

import numpy as np
A = np.random.normal(size = (3,3))

现在要获得列的总和,只需使用点积。

np.dot(A, np.ones(3))

要叠加行而不是列,只需转置矩阵。

np.dot(A.T, np.ones(3))