我的数据以制表符分隔,如下所示:
Name Count Sample
Dog .0001 1
Dog .00003 1
Dog .0001 2
Cat .0004 1
Cat .0002 1
Cat .0003 2
Cat .0002 2
在我将变量unid定义为第一列与第3列(例如Dog_1)合并并且num作为该行的Count之后,我将每个num附加到unid下的字典中(使用Python 2.7),如下所示:
for line in K:
sp = line.split("\t")
name = sp[0]
unid = sp[3][:-2] +"_"+ sp[0]
num = int(Decimal(sp[1]))
if not dict1.has_key(unid):
dict1[unid] = []
dict1[unid].append(num)
我试着用它来总结:
dictTot = sum(dict1.values())
但我收到此错误消息:
TypeError: unsupported operand type(s) for +: 'int' and 'list'
如何对这些值求和,以便我可以检索Cat_1: .0006, Cat_2: .0005
等?
对不起大家,我知道吗?不是很好。但正如雅各布在下面所说, “dictTot = sum(dict1.values()中值的总和(值)”对所有总和求和,但我要求的是独立地对每个键下的每组值求和,这样我就可以找出有多少猫样品1等等。也许总和不适合这个?对不起,很明显我不是非凡的Python。
答案 0 :(得分:2)
这不是sum
的工作原理。您试图通过“添加”一堆列表来获取整数(或数值类型),因此内置函数会变得棘手。试试这个:
dictTot = sum(sum(value) for value in dict1.values())
这将总结所有的金额,这就是你想要的(我认为)。
修改强>
显然,您想要对列表中每个元素中的所有值求和。为此,您可以使用dictionary comprehension:
dictTot = {key:sum(l_values) for key, l_values in dict1.items()}
答案 1 :(得分:1)
我基本上重写了整个事情......
K = "Dog .0001 1\n Dog .00003 1\n Dog .0001 2\n Cat .0004 1\n Cat .0002 1\n Cat .0003 2\n Cat .0002 2"
dict1 = {}
for line in K.split("\n"):
sp = line.split()
name = sp[0]
unid = "_".join([sp[0] , sp[2][-2:]])
num = float(sp[1])
if not dict1.has_key(unid):
dict1[unid] = [num,]
else :
dict1[unid].append(num)
print(dict1)
dictTot = sum([sum(x) for x in dict1.values()])
print(dictTot)
最后的词典是
{'Dog_2': [0.0001],
'Dog_1': [0.0001, 3e-05],
'Cat_1': [0.0004, 0.0002],
'Cat_2': [0.0003, 0.0002]}
总和是
0.00133
值是列表,因此您希望将它们循环为单独求和。
修改强>
显然现在你想要“Cat_1:.0006,Cat_2:.0005等”,所以在dict1
,你可以做到
for key in dict1.iterkeys():
dict1[key] = sum(dict1[key])
现在dict1
变为
{'Dog_2': 0.0001,
'Dog_1': 0.00013,
'Cat_1': 0.0006,
'Cat_2': 0.0005}
答案 2 :(得分:1)
为了对所有值求和,必须首先将所有列表连接到一个sum()
可以处理的可迭代中。以下是两种方法:
dictTot = sum(sum(dict1.values(), []))
稍微冗长,但更具可读性:
from itertools import chain
dictTot = sum(chain.from_iterable(dict1.values()))
sum()
实际上有两个参数。第二个参数start
默认为0
。因此,您收到有关向int
添加list
的错误消息。从本质上讲,它是这样做的:0 + [1, 2, 3] + [1, 2]...
。在我的第一个示例中,我将默认开始值设置为空列表。结果是一个列表。现在我将所有值都放在一个列表中,我可以sum()
得到答案的结果。
修改强>
响应您的更新:
您可以使用生成器表达式执行此操作:
dictTot = {key: sum(value) for key, value in dictTot.items()}
或者如果您正在使用< Python 2.7:
dictTot = dict((key, sum(value)) for key, value in dictTot.iteritems())
答案 3 :(得分:0)
答案:
dict((k,sum(v)) for k,v in dict1.iteritems())
是的,更改int(Decimal('.0001'))
并使用defaultdict
对于带有downvotes的问题+1,然后是4个错过oneliner答案的答案
编辑哎呀我错过了@Joel Cornett也有这样的支持
答案 4 :(得分:0)
这有效:
d={}
for line in K:
sp = line.strip().split()
unid = sp[0]+"_"+sp[-1]
num = decimal.Decimal(sp[1])
d.setdefault(unid,[]).append(num)
print({k:sum(v) for k, v in d.items()})
打印:
{'Dog_1': Decimal('0.00013'),
'Cat_2': Decimal('0.0005'),
'Cat_1': Decimal('0.0006'),
'Dog_2': Decimal('0.0001')}