python set .__ contains__的意外行为

时间:2011-09-26 00:55:35

标签: python list set

借用__contains__文档

中的文档
print set.__contains__.__doc__
x.__contains__(y) <==> y in x.

这似乎适用于原始对象,如int,basestring等。但对于定义__ne____eq__方法的用户定义对象,我会遇到意外行为。以下是示例代码:

class CA(object):
  def __init__(self,name):
    self.name = name

  def __eq__(self,other):
    if self.name == other.name:
      return True
    return False

  def __ne__(self,other):
    return not self.__eq__(other)

obj1 = CA('hello')
obj2 = CA('hello')

theList = [obj1,]
theSet = set(theList)

# Test 1: list
print (obj2 in theList)  # return True

# Test 2: set weird
print (obj2 in theSet)  # return False  unexpected

# Test 3: iterating over the set
found = False
for x in theSet:
  if x == obj2:
    found = True

print found   # return True

# Test 4: Typcasting the set to a list
print (obj2 in list(theSet))  # return True

这是一个错误还是一个功能?

3 个答案:

答案 0 :(得分:7)

对于setdicts,您需要定义__hash__。任何两个相等的对象都应该使用相同的哈希值,以便在setdicts中获得一致/预期的行为。

我建议使用_key方法,然后只需在需要比较项目部分的地方引用该方法,就像从__eq__调用__ne__而不是重新实现它一样:

class CA(object):
  def __init__(self,name):
    self.name = name

  def _key(self):
    return type(self), self.name

  def __hash__(self):
    return hash(self._key())

  def __eq__(self,other):
    if self._key() == other._key():
      return True
    return False

  def __ne__(self,other):
    return not self.__eq__(other)

答案 1 :(得分:3)

这是因为CA未实现__hash__

明智的实施方式是:

def __hash__(self):
    return hash(self.name)

答案 2 :(得分:2)

set 散列它的元素以允许快速查找。您必须覆盖__hash__方法才能找到元素:

class CA(object):
  def __hash__(self):
    return hash(self.name)

列表不使用散列,但比较for循环所做的每个元素。