我有一个清单
[[0.5, 2], [0.5, 5], [2, 3], [2, 6], [2, 0.6], [7, 1]]
我需要将每个子列表中的第二个元素相加得到唯一的第一个元素的输出。在这种情况下是:
[[0.5, 7], [2, 9.6], [7, 1]]
[0.5, 7]
将[0.5, 2]
和[0.5, 5]
的第二个元素相加。
对于长度为1000的列表,最有效的方法是什么。
答案 0 :(得分:4)
使用defaultdict
进行累积:
>>> from collections import defaultdict
>>> data = defaultdict(int)
>>> L = [[0.5, 2], [0.5, 5], [2, 3], [2, 6], [2, 0.6], [7, 1]]
>>> for k, v in L:
... data[k] += v
...
>>> [[k,v] for (k,v) in data.items()]
[[0.5, 7], [2, 9.6], [7, 1]]
请注意,即使这是int的默认值,2的值也会通过加法自动“提升”为浮点数。这是为了与问题中发布的期望输出匹配,但是我认为您应该考虑使用同质输出类型,而不要使用int和float的混合。
答案 1 :(得分:1)
使用熊猫,您可以保留数据的原始“顺序”:
pairs = [[0.5, 2], [0.5, 5], [2, 3], [2, 6], [2, 0.6], [7, 1]]
df = pd.DataFrame(pairs)
>>> [tup[0] for tup in zip(df.groupby(0, sort=False, as_index=False).sum().values.tolist())]
[[0.5, 7.0], [2.0, 9.6], [7.0, 1.0]]
答案 2 :(得分:1)
您可以摆脱排序和itertools.groupby
:
from operator import itemgetter
from itertools import groupby
data = [[0.5, 2], [0.5, 5], [2, 3], [2, 6], [2, 0.6], [7, 1]]
key = itemgetter(0)
data.sort(key=key) # Use data = sorted(data, key=key) to avoid clobbering
result = [[k, sum(group)] for k, group in groupby(data, key)]
这不会保留键的原始顺序。
答案 3 :(得分:1)
这项工作可以吗?
L = [[0.5, 2], [0.5, 5], [2, 3], [2, 6], [2, 0.6], [7, 1]]
nums = []
d = {}
for lst in L:
if lst[0] not in d:
d[lst[0]] = []
nums.append(lst[0])
d[lst[0]].append(lst[1])
for key in nums:
print [key, sum(d[key])]
输出:
[0.5, 7]
[2, 9.6]
[7, 1]