为什么Python不喜欢列表?

时间:2012-05-06 19:53:21

标签: python python-2.x

在Python(2.7.2)中,为什么

import dis
dis.dis("i in (2, 3)")

按预期工作,而

import dis
dis.dis("i in [2, 3]")

提出:

Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "/usr/lib/python2.7/dis.py", line 45, in dis
  disassemble_string(x)
File "/usr/lib/python2.7/dis.py", line 112, in disassemble_string
  labels = findlabels(code)
File "/usr/lib/python2.7/dis.py", line 166, in findlabels
 oparg = ord(code[i]) + ord(code[i+1])*256
IndexError: string index out of range

请注意,这不会影响Python3。

3 个答案:

答案 0 :(得分:29)

简答

在Python 2.x中,str类型保存原始字节,因此dis假定如果您传递一个字符串,它将获得编译的字节码。它试图将你传递给它的字符串反汇编为字节码,并且 - 纯粹由于Python字节码的实现细节 - 对i in (2,3)成功。但显然,它会带来胡言乱语。

在Python 3.x中,str类型用于字符串bytes类型用于原始字节,因此dis可以区分已编译的字节码和字符串 - 并假设它获得源代码,如果它得到一个字符串。


长答案

这是我为解决这个问题而采取的思考过程。

  1. 我在我的Python(3.2)上尝试过它:

    >>> import dis
    >>> dis.dis("i in (2,3)")  
      1           0 LOAD_NAME                0 (i)
                  3 LOAD_CONST               2 ((2, 3))
                  6 COMPARE_OP               6 (in)
                  9 RETURN_VALUE
    >>> dis.dis("i in [2,3]")
      1           0 LOAD_NAME                0 (i)
                  3 LOAD_CONST               2 ((2, 3))
                  6 COMPARE_OP               6 (in)
                  9 RETURN_VALUE
    

    显然,这有效。

  2. 我在Python 2.7上尝试过:

    >>> import dis
    >>> dis.dis("i in (2,3)")
              0 BUILD_MAP       26912
              3 JUMP_FORWARD    10272 (to 10278)
              6 DELETE_SLICE+0
              7 <44>
              8 DELETE_SLICE+1
              9 STORE_SLICE+1
    >>> dis.dis("i in [2,3]")
    Traceback (most recent call last):
      File "<stdin>", line 1, in <module>
      File "C:\Python27\lib\dis.py", line 45, in dis
        disassemble_string(x)
      File "C:\Python27\lib\dis.py", line 112, in disassemble_string
        labels = findlabels(code)
      File "C:\Python27\lib\dis.py", line 166, in findlabels
        oparg = ord(code[i]) + ord(code[i+1])*256
    IndexError: string index out of range
    

    啊哈!另请注意,Python 3.2中生成的字节码是您所期望的(“加载i,加载(2,3),测试成员资格,返回结果”)而您在Python 2.7中获得的字符串是乱码。显然,dis将字符串反编译为2.7中的字节码,但在3.2中将其编译为Python。

  3. 我查看了dis.dis的源代码。以下是要点:

    Python 2.7:

    elif isinstance(x, str):
        disassemble_string(x)
    

    Python 3.2:

       elif isinstance(x, (bytes, bytearray)): # Raw bytecode
           _disassemble_bytes(x)
       elif isinstance(x, str):    # Source code
           _disassemble_str(x)
    

    为了好玩,让我们通过在Python 3中将相同的字节传递给dis来检查:

    >>> dis.dis("i in (2,3)".encode())
              0 BUILD_MAP       26912
              3 JUMP_FORWARD    10272 (to 10278)
              6 <50>
              7 <44>
              8 <51>
              9 <41>
    

    啊哈!胡言乱语! (虽然请注意它的乱码略有不同 - 字节码随Python版本而改变了!)

答案 1 :(得分:18)

dis.dis期望字节码作为参数,而不是python源代码。虽然您的第一个示例“有效”,但它不提供任何有意义的输出。你可能想要:

import compiler, dis

code = compiler.compile("i in [2, 3]", '', 'single')
dis.dis(code)

这可以按预期工作。 (我只在2.7中测试过。)

答案 2 :(得分:9)

如果你只是想为一个简单的表达式获取字节码,将它作为lambda传递给dis,你的表达式作为lambda的主体是最简单的:

>>> import dis
>>> dis.dis(lambda i : i in [3,2])
  1           0 LOAD_FAST                0 (i)
              3 LOAD_CONST               2 ((3, 2))
              6 COMPARE_OP               6 (in)
              9 RETURN_VALUE