Question

我在python中有这样的列表：

list1 = [('a', 6.5),('a', 6.5),('a', -6.5),('b', 0.0),('b', 0.0),('b',6.5),('b', -6.5)('b',6.5)]

我需要一个包含以下内容的列表：

[(a,avg(6.5,6.5,-6.5),no.of_occurences_of_a),(b,avg(0.0,6.5,-6.5,6.5),no.of_occurences_of_b)]

即

[(a,6.5/3,3)(b,6.5/4,4)]

怎么做？

Answer 1

您可以使用itertools.groupby：

In [19]: list1 = [('a', 6.5),('a', 6.5),('a', -6.5),('b', 0.0),('b', 0.0),('b',6.5),('b', -6.5),('b',6.5)]

In [20]: from itertools import groupby

In [21]: from operator import itemgetter

In [22]: lis=[]

In [23]: for k,v in groupby(list1,key=itemgetter(0)):
    items=[x[1] for x in v]
    lis.append((k, sum(items)/len(items), len(items)))
   ....:     

In [24]: lis
Out[24]: [('a', 2.1666666666666665, 3), ('b', 1.3, 5)]

请注意，如果list未排序，您可以先使用itertools.groupby对其进行排序以获得所需的结果。

使用collections.defaultdict，这也适用于未分类的项目：

In [25]: from collections import defaultdict

In [26]: dic=defaultdict(list)

In [27]: for k,v in list1:
   ....:     dic[k].append(v)
   ....:     

In [28]: dic
Out[28]: defaultdict(<type 'list'>, {'a': [6.5, 6.5, -6.5], 'b': [0.0, 0.0, 6.5, -6.5, 6.5]})

In [29]: [(k,sum(v)/len(v),len(v)) for k,v in dic.items()]
Out[29]: [('a', 2.1666666666666665, 3), ('b', 1.3, 5)]

Answer 2

使用itertools.groupby。通常它会是一个单行，但在你的情况下它有点棘手，因为你需要消耗一组两次以获得平均值和长度：

list1 = [('a', 6.5), ('a', 6.5), ('a', -6.5), ('b', 0.0),
         ('b', 0.0), ('b', 6.5), ('b', -6.5), ('b',6.5)]

import itertools
import operator

fst = operator.itemgetter(0)
snd = operator.itemgetter(1)
result = []
for grouper, group in itertools.groupby(sorted(list1, key=fst), key=fst):
    items = map(snd, group)
    result.append((grouper, sum(items)/len(items), len(items)))

Answer 3

难看的解决方案（未按您的要求格式化）：

list1 = [('a', 6.5),('a', 6.5),('a', -6.5),('b', 0.0),('b', 0.0),('b',6.5),('b', -6.5),('b',6.5)]

a_list = []
b_list = []
a = 0
b = 0
for item in list1:
    if 'a' in item:
        a_list.append(item[1])
        a += 1
    if 'b' in item:
        b_list.append(item[1])
        b +=1

#a is now the count of a's
#b is now the count of b's
a_avarage = reduce(lambda x, y: x + y, a_list)
b_avarage = reduce(lambda x, y: x + y, b_list)

Python列表中的分组

3 个答案: