在python中,如何在字典中找到值的总和?每个键都有多个值

时间:2012-06-29 19:50:25

标签: python dictionary

我的数据以制表符分隔,如下所示:

Name   Count    Sample
Dog    .0001    1
Dog    .00003   1
Dog    .0001    2
Cat    .0004    1
Cat    .0002    1
Cat    .0003    2
Cat    .0002    2

在我将变量unid定义为第一列与第3列(例如Dog_1)合并并且num作为该行的Count之后,我将每个num附加到unid下的字典中(使用Python 2.7),如下所示:

for line in K:
        sp = line.split("\t")
        name = sp[0]
        unid = sp[3][:-2] +"_"+ sp[0]
        num = int(Decimal(sp[1]))
        if not dict1.has_key(unid):
            dict1[unid] = []
        dict1[unid].append(num)

我试着用它来总结:

dictTot = sum(dict1.values())

但我收到此错误消息:

TypeError: unsupported operand type(s) for +: 'int' and 'list'

如何对这些值求和,以便我可以检索Cat_1: .0006, Cat_2: .0005等?

对不起大家,我知道吗?不是很好。但正如雅各布在下面所说, “dictTot = sum(dict1.values()中值的总和(值)”对所有总和求和,但我要求的是独立地对每个键下的每组值求和,这样我就可以找出有多少猫样品1等等。也许总和不适合这个?对不起,很明显我不是非凡的Python。

5 个答案:

答案 0 :(得分:2)

这不是sum的工作原理。您试图通过“添加”一堆列表来获取整数(或数值类型),因此内置函数会变得棘手。试试这个:

dictTot = sum(sum(value) for value in dict1.values())

这将总结所有的金额,这就是你想要的(我认为)。

修改

显然,您想要对列表中每个元素中的所有值求和。为此,您可以使用dictionary comprehension

dictTot = {key:sum(l_values) for key, l_values in dict1.items()}

答案 1 :(得分:1)

我基本上重写了整个事情......

K = "Dog    .0001    1\n  Dog    .00003   1\n  Dog    .0001    2\n  Cat    .0004   1\n  Cat    .0002    1\n  Cat    .0003    2\n  Cat    .0002    2"
dict1 = {}
for line in K.split("\n"):
    sp = line.split()
    name = sp[0]
    unid = "_".join([sp[0] , sp[2][-2:]])
    num = float(sp[1])
    if not dict1.has_key(unid):
        dict1[unid] = [num,]
    else :
        dict1[unid].append(num)
print(dict1)
dictTot = sum([sum(x) for x in dict1.values()])
print(dictTot)
最后的词典是

{'Dog_2': [0.0001], 
 'Dog_1': [0.0001, 3e-05], 
 'Cat_1': [0.0004, 0.0002], 
 'Cat_2': [0.0003, 0.0002]}

总和是

0.00133

值是列表,因此您希望将它们循环为单独求和。

修改

显然现在你想要“Cat_1:.0006,Cat_2:.0005等”,所以在dict1,你可以做到

for key in dict1.iterkeys():
    dict1[key] = sum(dict1[key])

现在dict1变为

{'Dog_2': 0.0001, 
 'Dog_1': 0.00013, 
 'Cat_1': 0.0006, 
 'Cat_2': 0.0005}

答案 2 :(得分:1)

为了对所有值求和,必须首先将所有列表连接到一个sum()可以处理的可迭代中。以下是两种方法:

dictTot = sum(sum(dict1.values(), []))

稍微冗长,但更具可读性:

from itertools import chain
dictTot = sum(chain.from_iterable(dict1.values()))

sum()实际上有两个参数。第二个参数start默认为0。因此,您收到有关向int添加list的错误消息。从本质上讲,它是这样做的:0 + [1, 2, 3] + [1, 2]...。在我的第一个示例中,我将默认开始值设置为空列表。结果是一个列表。现在我将所有值都放在一个列表中,我可以sum()得到答案的结果。

修改

响应您的更新:

您可以使用生成器表达式执行此操作:

dictTot = {key: sum(value) for key, value in dictTot.items()}

或者如果您正在使用< Python 2.7:

dictTot = dict((key, sum(value)) for key, value in dictTot.iteritems())

答案 3 :(得分:0)

答案:

dict((k,sum(v)) for k,v in dict1.iteritems())

是的,更改int(Decimal('.0001'))并使用defaultdict

对于带有downvotes的问题+1,然后是4个错过oneliner答案的答案

编辑哎呀我错过了@Joel Cornett也有这样的支持

答案 4 :(得分:0)

这有效:

d={}
for line in K:
   sp = line.strip().split()
   unid = sp[0]+"_"+sp[-1] 
   num = decimal.Decimal(sp[1])
   d.setdefault(unid,[]).append(num)      

print({k:sum(v) for k, v in d.items()})

打印:

{'Dog_1': Decimal('0.00013'), 
 'Cat_2': Decimal('0.0005'), 
 'Cat_1': Decimal('0.0006'), 
 'Dog_2': Decimal('0.0001')}