Python列表中的分组

时间:2013-04-21 19:17:36

标签: python list python-2.7

我在python中有这样的列表:

list1 = [('a', 6.5),('a', 6.5),('a', -6.5),('b', 0.0),('b', 0.0),('b',6.5),('b', -6.5)('b',6.5)]

我需要一个包含以下内容的列表:

[(a,avg(6.5,6.5,-6.5),no.of_occurences_of_a),(b,avg(0.0,6.5,-6.5,6.5),no.of_occurences_of_b)]

[(a,6.5/3,3)(b,6.5/4,4)]

怎么做?

3 个答案:

答案 0 :(得分:3)

您可以使用itertools.groupby

In [19]: list1 = [('a', 6.5),('a', 6.5),('a', -6.5),('b', 0.0),('b', 0.0),('b',6.5),('b', -6.5),('b',6.5)]

In [20]: from itertools import groupby

In [21]: from operator import itemgetter

In [22]: lis=[]

In [23]: for k,v in groupby(list1,key=itemgetter(0)):
    items=[x[1] for x in v]
    lis.append((k, sum(items)/len(items), len(items)))
   ....:     

In [24]: lis
Out[24]: [('a', 2.1666666666666665, 3), ('b', 1.3, 5)]

请注意,如果list未排序,您可以先使用itertools.groupby对其进行排序以获得所需的结果。

使用collections.defaultdict,这也适用于未分类的项目:

In [25]: from collections import defaultdict

In [26]: dic=defaultdict(list)

In [27]: for k,v in list1:
   ....:     dic[k].append(v)
   ....:     

In [28]: dic
Out[28]: defaultdict(<type 'list'>, {'a': [6.5, 6.5, -6.5], 'b': [0.0, 0.0, 6.5, -6.5, 6.5]})

In [29]: [(k,sum(v)/len(v),len(v)) for k,v in dic.items()]
Out[29]: [('a', 2.1666666666666665, 3), ('b', 1.3, 5)]

答案 1 :(得分:1)

使用itertools.groupby。通常它会是一个单行,但在你的情况下它有点棘手,因为你需要消耗一组两次以获得平均值和长度:

list1 = [('a', 6.5), ('a', 6.5), ('a', -6.5), ('b', 0.0),
         ('b', 0.0), ('b', 6.5), ('b', -6.5), ('b',6.5)]

import itertools
import operator

fst = operator.itemgetter(0)
snd = operator.itemgetter(1)
result = []
for grouper, group in itertools.groupby(sorted(list1, key=fst), key=fst):
    items = map(snd, group)
    result.append((grouper, sum(items)/len(items), len(items)))

答案 2 :(得分:1)

难看的解决方案(未按您的要求格式化):

list1 = [('a', 6.5),('a', 6.5),('a', -6.5),('b', 0.0),('b', 0.0),('b',6.5),('b', -6.5),('b',6.5)]

a_list = []
b_list = []
a = 0
b = 0
for item in list1:
    if 'a' in item:
        a_list.append(item[1])
        a += 1
    if 'b' in item:
        b_list.append(item[1])
        b +=1

#a is now the count of a's
#b is now the count of b's
a_avarage = reduce(lambda x, y: x + y, a_list)
b_avarage = reduce(lambda x, y: x + y, b_list)