使用直方图对列表进行排序

时间:2012-12-01 19:08:55

标签: python

给定直方图作为字典,什么是最pythonic,“电池包括”的方式排序列表,该列表只有字典中的元素,按字典中定义的频率?

字典的键(以及隐含的列表中的值)是字符串,频率存储为整数。

我只对python2解决方案感兴趣,但是也欢迎你写一个python解决方案,所以其他人也可以从中受益(将来)。

2 个答案:

答案 0 :(得分:7)

>>> inList = [1,2,3,4,5]
>>> inDict = {1:5, 2:2, 3:4, 4:1, 5:3}
>>> sorted(inList, key=lambda x: inDict.get(x,0))
[4, 2, 5, 3, 1]

这也有利于排除不在dict中的元素,就好像它在dict中的值为0,而不仅仅是引发KeyError

sorted()函数有一个可选参数'key'。此参数指定一个参数的函数,该函数用于从每个列表元素中提取比较键。此比较键用于确定元素之间的排序。

答案 1 :(得分:0)

在生成直方图时,我通常使用collections.Counter,它具有内置的.most_common()方法。您可以将类似计数器的字典传递给Counter,它将以您想象的方式工作。

>>> test_dict = {1: 6, 2: 8, 3: 2, 4: 4, 5: 8, 6: 4, 7: 10, 8: 3, 9: 7}
>>> c = Counter(test_dict)

# returns a list of tuples with the (item, count) values.  
>>> c.most_common()
[(7, 10), (2, 8), (5, 8), (9, 7), (1, 6), (4, 4), (6, 4), (8, 3), (3, 2)]

# if you want only the counts:
>>> [count for item, count in c.most_common()]
[10, 8, 8, 7, 6, 4, 4, 3, 2]

# if you want only the objects:
>>> [item for item, count in c.most_common()]
[7, 2, 5, 9, 1, 4, 6, 8, 3]    

# if you want them in reverse order
>>> [item for item, count in c.most_common()][::-1]
[3, 8, 6, 4, 1, 9, 5, 2, 7]

从基于列表的输入创建原始计数的某个子集的计数器对象是微不足道的。您可以使用函数:

def return_count_from_list(oldcount, my_list):
    count = Counter()
    for i in my_list:
        count[i] = oldcount[i]
    return count

或者,如果您只想要结果,可以像下面这样列出您的列表:

my_list = [1, 4, 5]
>>> [count for item, count in c.most_common() if item in my_list]
[8, 6, 4]