我在python中有这样的列表:
list1 = [('a', 6.5),('a', 6.5),('a', -6.5),('b', 0.0),('b', 0.0),('b',6.5),('b', -6.5)('b',6.5)]
我需要一个包含以下内容的列表:
[(a,avg(6.5,6.5,-6.5),no.of_occurences_of_a),(b,avg(0.0,6.5,-6.5,6.5),no.of_occurences_of_b)]
即
[(a,6.5/3,3)(b,6.5/4,4)]
怎么做?
答案 0 :(得分:3)
您可以使用itertools.groupby
:
In [19]: list1 = [('a', 6.5),('a', 6.5),('a', -6.5),('b', 0.0),('b', 0.0),('b',6.5),('b', -6.5),('b',6.5)]
In [20]: from itertools import groupby
In [21]: from operator import itemgetter
In [22]: lis=[]
In [23]: for k,v in groupby(list1,key=itemgetter(0)):
items=[x[1] for x in v]
lis.append((k, sum(items)/len(items), len(items)))
....:
In [24]: lis
Out[24]: [('a', 2.1666666666666665, 3), ('b', 1.3, 5)]
请注意,如果list
未排序,您可以先使用itertools.groupby
对其进行排序以获得所需的结果。
使用collections.defaultdict
,这也适用于未分类的项目:
In [25]: from collections import defaultdict
In [26]: dic=defaultdict(list)
In [27]: for k,v in list1:
....: dic[k].append(v)
....:
In [28]: dic
Out[28]: defaultdict(<type 'list'>, {'a': [6.5, 6.5, -6.5], 'b': [0.0, 0.0, 6.5, -6.5, 6.5]})
In [29]: [(k,sum(v)/len(v),len(v)) for k,v in dic.items()]
Out[29]: [('a', 2.1666666666666665, 3), ('b', 1.3, 5)]
答案 1 :(得分:1)
使用itertools.groupby
。通常它会是一个单行,但在你的情况下它有点棘手,因为你需要消耗一组两次以获得平均值和长度:
list1 = [('a', 6.5), ('a', 6.5), ('a', -6.5), ('b', 0.0),
('b', 0.0), ('b', 6.5), ('b', -6.5), ('b',6.5)]
import itertools
import operator
fst = operator.itemgetter(0)
snd = operator.itemgetter(1)
result = []
for grouper, group in itertools.groupby(sorted(list1, key=fst), key=fst):
items = map(snd, group)
result.append((grouper, sum(items)/len(items), len(items)))
答案 2 :(得分:1)
难看的解决方案(未按您的要求格式化):
list1 = [('a', 6.5),('a', 6.5),('a', -6.5),('b', 0.0),('b', 0.0),('b',6.5),('b', -6.5),('b',6.5)]
a_list = []
b_list = []
a = 0
b = 0
for item in list1:
if 'a' in item:
a_list.append(item[1])
a += 1
if 'b' in item:
b_list.append(item[1])
b +=1
#a is now the count of a's
#b is now the count of b's
a_avarage = reduce(lambda x, y: x + y, a_list)
b_avarage = reduce(lambda x, y: x + y, b_list)