在字典列表上应用set操作

时间:2016-04-29 07:10:26

标签: python list dictionary set

我的列表多次包含相同的词典,如

[ {'name': 'ZYLOG SYSTEMS LTD', 'gram': '1'}, {'name': 'ZYLOG SYSTEMS LTD', 'gram': '1'}]

当我对此应用set操作以使其区别时,它会给出

TypeError: unhashable type: 'dict'

使这种列表项不同的正确方法是什么?

2 个答案:

答案 0 :(得分:4)

字典是可变对象,因此无法存储在集合中。您可以将字典转换为表示相同数据的不可变对象;在对这些操作应用set()操作后,您可以转换回字典:

unique = [dict(t) for t in set(tuple(sorted(d.items())) for d in l)]

这会将每个字典转换为包含所有键值对的排序元组;这假设字典中的也是不可变的。

排序是必需的,因为可以生成两个具有相同键值对的词典,但由于哈希冲突而以不同的顺序列出这些词典;两个键可以映射到相同的哈希表槽,但首先插入的键将赢得:

>>> {'bar': 42, 'baz': 81} == {'baz': 81, 'bar': 42}
True
>>> list({'bar': 42, 'baz': 81}) == list({'baz': 81, 'bar': 42})  # compare keys in order
False

答案 1 :(得分:2)

一种简单的方法是将每个dict转换为字符串并在其上使用set,然后将每个字符串转换回dict

>>> import ast
>>> l=[ {'name': 'ZYLOG SYSTEMS LTD', 'gram': '1'}, {'name': 'ZYLOG SYSTEMS LTD', 'gram': '1'}]
>>> l
[{'name': 'ZYLOG SYSTEMS LTD', 'gram': '1'}, {'name': 'ZYLOG SYSTEMS LTD', 'gram': '1'}]
>>> [ast.literal_eval(i) for i in set(map(str, l))]
[{'name': 'ZYLOG SYSTEMS LTD', 'gram': '1'}]
>>>

针对不同排序的另一种方法,我们将每个dict转换为tuple

>>> l=[ {'name': 'ZYLOG SYSTEMS LTD', 'gram': '1'}, {'gram': '1', 'name': 'ZYLOG SYSTEMS LTD'}]
>>> set([tuple(d.items()) for d in l])
{(('name', 'ZYLOG SYSTEMS LTD'), ('gram', '1'))}
>>> [dict(i) for i in set([tuple(sorted(d.items())) for d in l])]
[{'name': 'ZYLOG SYSTEMS LTD', 'gram': '1'}]
>>>