Python3中的唯一类实例

时间:2016-04-01 10:34:35

标签: python numpy unique

假设我有类似这样的类定义

class structure:
    def __init__(self, handle):
        self.handle = handle

如何使用numpy.unique或Python3的其他工具在此类的实例列表中查找唯一元素?应该对'handle'字段的值进行比较。

1 个答案:

答案 0 :(得分:6)

numpy.unique不是自定义类的最佳工具。制作实例hashable(实施__hash____eq__),然后使用集合将实例列表缩减为唯一值:

class structure:
    def __init__(self, handle):
        self.handle = handle

    def __hash__(self):
        return hash(self.handle)

    def __eq__(self, other):
        if not isinstance(other, structure):
            # only equality tests to other `structure` instances are supported
            return NotImplemented
        return self.handle == other.handle

有效地设置可以通过散列检测重复,确认具有相同散列的对象首先也是相等的。

要获取唯一实例,只需在一系列实例上调用set()

unique_structures = set(list_of_structures)

演示:

>>> class structure:
...     def __init__(self, handle):
...         self.handle = handle
...     def __hash__(self):
...         return hash(self.handle)
...     def __eq__(self, other):
...         if not isinstance(other, structure):
...             # only equality tests to other `structure` instances are supported
...             return NotImplemented
...         return self.handle == other.handle
...     def __repr__(self):
...         return '<structure({!r})>'.format(self.handle)
...
>>> list_of_structures = [structure('foo'), structure('bar'), structure('foo'), structure('spam'), structure('spam')]
>>> set(list_of_structures)
{<structure('bar')>, <structure('foo')>, <structure('spam')>}

请注意,存储在集合中或使用字典键的任何structure实例的哈希值不得更改;在实例的生命周期内不改变handle属性是确保这一点的最简单方法。