在Python中子类化set时定义__repr__

时间:2011-12-13 18:37:03

标签: python set subclassing

我正在尝试使用类似于下面的代码对Python中的set对象进行子类化,但我无法确定要使用的__repr__的合理定义。

class Alpha(set):
    def __init__(self, name, s=()):
        super(Alpha, self).__init__(s)
        self.name = name

我想以这样的方式定义__repr__,我可以获得以下输出:

>>> Alpha('Salem', (1,2,3))
Alpha('Salem', set([1, 2, 3]))

但是,如果我不覆盖__repr__,我得到的输出会忽略name值......

>>> Alpha('Salem', (1,2,3))
Alpha([1, 2, 3])

...如果我覆盖__repr__,我无法在不创建新的集合实例的情况下直接访问集合中的值:

class Alpha(set):
    …
    def __repr__(self):
        return "%s(%r, %r)" % (self.__class__.__name__, self.name, set(self))

这样可行,但为__repr__创建一个新的集合实例,然后将被处理掉,这对我来说似乎很笨拙和低效。

有没有更好的方法为这类课程定义__repr__

编辑:我遇到的另一种解决方案:我可以在本地存储该集。它似乎比其他选项(为__repr__的每次调用创建和销毁某些东西或使用某种形式的字符串操作)稍微整洁一些,但对我来说似乎仍然不太理想。

class Alpha(set):
    def __init__(self, name, s=()):
        super(Alpha, self).__init__(s)
        self.name = name
        self._set = set(s)
    def __repr__(self):
        return "%s(%r, %r)" % (self.__class__.__name__, self.name, self._set)

2 个答案:

答案 0 :(得分:8)

我认为除了展示一些基准外,我还能找到你想要的东西。虽然我确信内存使用量存在差异,但它们几乎都是等效的。

#!/usr/bin/env python

import time

class Alpha(set):
    def __init__(self, name, s=()):
            super(Alpha, self).__init__(s)
            self.name = name
    def __repr__(self):
            return '%s(%r, set(%r))' % (self.__class__.__name__, 
                                        self.name, 
                                        list(self))

class Alpha2(set):
    def __init__(self, name, s=()):
            super(Alpha2, self).__init__(s)
            self.name = name
    def __repr__(self):
            return '%s(%r, set(%r))' % (self.__class__.__name__, 
                                        self.name, 
                                        set(self))

class Alpha3(set):
    def __init__(self, name, s=()):
            super(Alpha3, self).__init__(s)
            self.name = name
    def __repr__(self):
            rep = super(Alpha3, self).__repr__()
            rep = rep.replace(self.__class__.__name__, 'set', 1)
            return '%s(%r, %s)' % (self.__class__.__name__, 
                                    self.name, 
                                    rep)

def timeit(exp, repeat=10000):
    results = []
    for _ in xrange(repeat):
        start = time.time()
        exec(exp)
        end = time.time()-start
        results.append(end*1000)
    return sum(results) / len(results)

if __name__ == "__main__":
    print "Alpha():  ", timeit("a = Alpha('test', (1,2,3,4,5))")
    print "Alpha2(): ", timeit("a = Alpha2('test', (1,2,3,4,5))")
    print "Alpha3(): ", timeit("a = Alpha3('test', (1,2,3,4,5))")

结果:

Alpha():0.0287627220154

Alpha2():0.0286467552185

Alpha3():0.0285225152969

答案 1 :(得分:2)

我找不到比这更好的方法了。我认为这比扔掉一套更好。

(Python 2.x)

>>> class Alpha(set):
...     def __init__(self, name, s=()):
...             super(Alpha, self).__init__(s)
...             self.name = name
...     def __repr__(self):
...             return 'Alpha(%r, set(%r))' % (self.name, list(self))
... 
>>> Alpha('test', (1, 2))
Alpha('test', set([1, 2]))

或者,如果您不喜欢硬编码的类名(尽管它确实无关紧要)。

>>> class Alpha(set):
...     def __init__(self, name, s=()):
...             super(Alpha, self).__init__(s)
...             self.name = name
...     def __repr__(self):
...             return '%s(%r, set(%r))' % (self.__class__.__name__, self.name, list(self))
... 
>>> Alpha('test', (1, 2))
Alpha('test', set([1, 2]))