使用__getitem__ python 3.5 vs python 3.6解压缩不同行为的就地自定义对象

时间:2018-05-17 06:17:35

标签: python python-3.x python-3.5 python-3.6 python-internals

关于this question的后续问题:我在python 3.5和python 3.6上运行了以下代码 - 结果非常不同:

class Container:

    KEYS = ('a', 'b', 'c')

    def __init__(self, a=None, b=None, c=None):
        self.a = a
        self.b = b
        self.c = c

    def keys(self):
        return Container.KEYS

    def __getitem__(self, key):
        if key not in Container.KEYS:
            raise KeyError(key)
        return getattr(self, key)

    def __str__(self):
        # python 3.6
        # return f'{self.__class__.__name__}(a={self.a}, b={self.b}, c={self.c})'
        # python 3.5    
        return ('{self.__class__.__name__}(a={self.a}, b={self.b}, '
                'c={self.c})').format(self=self)

data0 = Container(a=1, b=2, c=3)
print(data0)

data3 = Container(**data0, b=7)
print(data3)

如上一个问题所述,这引发了

  

TypeError:type object为关键字参数'b'

获取了多个值

在python 3.6上。但是在python 3.5上我得到了例外:

  

KeyError:0

此外,如果我不提出KeyError但只打印key中的return__getitem__

def __getitem__(self, key):
    if key not in Container.KEYS:
        # raise KeyError(key)
        print(key)
        return
    return getattr(self, key)

这将打印出int序列0, 1, 2, 3, 4, ...。 (python 3.5)

所以我的问题是:

  • 版本之间发生了什么变化,使得这种行为变得如此不同?

  • 这些整数来自哪里?

UPDATE :正如λuser的评论中所述:实现__iter__将改变python 3.5上的行为以匹配python 3.6的行为:

def __iter__(self):
    return iter(Container.KEYS)

1 个答案:

答案 0 :(得分:4)

在解包自定义映射对象和创建调用者参数期间,这实际上是多个内部操作之间的复杂冲突。因此,如果您想彻底了解根本原因,我建议您查看源代码。但是,这里有一些提示和起点,您可以查看更多详细信息。

在内部,当你在调用者级别解压缩时,字节代码BUILD_MAP_UNPACK_WITH_CALL(count)从堆栈中弹出 count 映射,将它们合并到一个字典中并推送结果。另一方面,此操作码的堆栈效果包含参数oparg is defined as following

case BUILD_MAP_UNPACK_WITH_CALL:
    return 1 - oparg;

说到这一点,让我们看看一个例子的字节码(在Python-3.5中),看看这个在行动:

>>> def bar(data0):foo(**data0, b=4)
... 
>>> 
>>> dis.dis(bar)
  1           0 LOAD_GLOBAL              0 (foo)
              3 LOAD_FAST                0 (data0)
              6 LOAD_CONST               1 ('b')
              9 LOAD_CONST               2 (4)
             12 BUILD_MAP                1
             15 BUILD_MAP_UNPACK_WITH_CALL   258
             18 CALL_FUNCTION_KW         0 (0 positional, 0 keyword pair)
             21 POP_TOP
             22 LOAD_CONST               0 (None)
             25 RETURN_VALUE
>>> 

如您所见,在偏移量15处,我们有BUILD_MAP_UNPACK_WITH_CALL字节代码,负责解包。

现在它会返回0作为key方法的__getitem__参数会发生什么?

每当解释器在解包期间遇到异常时(在这种情况下是KeyError),它会停止继续推/弹流,而不是返回变量的实际值,它会返回堆栈效果,这就是为什么一开始键为0,如果每次获得递增结果时都没有处理异常(由于堆栈大小)。

现在,如果你在Python-3.6中进行相同的反汇编,你将得到以下结果:

>>> dis.dis(bar)
  1           0 LOAD_GLOBAL              0 (foo)
              2 BUILD_TUPLE              0
              4 LOAD_FAST                0 (data0)
              6 LOAD_CONST               1 ('b')
              8 LOAD_CONST               2 (4)
             10 BUILD_MAP                1
             12 BUILD_MAP_UNPACK_WITH_CALL     2
             14 CALL_FUNCTION_EX         1
             16 POP_TOP
             18 LOAD_CONST               0 (None)
             20 RETURN_VALUE

在创建局部变量(LOAD_FAST)之前和LOAD_GLOBAL之后,有一个BUILD_TUPLE,负责创建一个元组并从堆栈中消耗计数项。

  

BUILD_TUPLE(计数)

     

从堆栈中创建一个消耗计数项的元组,并将>结果元组推送到堆栈上。

这就是IMO,为什么你没有得到关键错误而是得到TypeError。因为在创建参数元组期间遇到重复的名称,因此正确地返回TypeError