假设我有类似这样的类定义
class structure:
def __init__(self, handle):
self.handle = handle
如何使用numpy.unique
或Python3的其他工具在此类的实例列表中查找唯一元素?应该对'handle'
字段的值进行比较。
答案 0 :(得分:6)
numpy.unique
不是自定义类的最佳工具。制作实例hashable(实施__hash__
和__eq__
),然后使用集合将实例列表缩减为唯一值:
class structure:
def __init__(self, handle):
self.handle = handle
def __hash__(self):
return hash(self.handle)
def __eq__(self, other):
if not isinstance(other, structure):
# only equality tests to other `structure` instances are supported
return NotImplemented
return self.handle == other.handle
有效地设置可以通过散列检测重复,确认具有相同散列的对象首先也是相等的。
要获取唯一实例,只需在一系列实例上调用set()
:
unique_structures = set(list_of_structures)
演示:
>>> class structure:
... def __init__(self, handle):
... self.handle = handle
... def __hash__(self):
... return hash(self.handle)
... def __eq__(self, other):
... if not isinstance(other, structure):
... # only equality tests to other `structure` instances are supported
... return NotImplemented
... return self.handle == other.handle
... def __repr__(self):
... return '<structure({!r})>'.format(self.handle)
...
>>> list_of_structures = [structure('foo'), structure('bar'), structure('foo'), structure('spam'), structure('spam')]
>>> set(list_of_structures)
{<structure('bar')>, <structure('foo')>, <structure('spam')>}
请注意,存储在集合中或使用字典键的任何structure
实例的哈希值不得更改;在实例的生命周期内不改变handle
属性是确保这一点的最简单方法。