"元组理解"和星形splat / unpack运算符*

时间:2017-11-30 12:23:36

标签: python python-3.x tuples list-comprehension generator-expression

我刚刚阅读了问题Why is there no tuple comprehension in Python?

comments of the accepted answer中,声明没有真正的"元组理解"。相反,我们当前的选项是使用生成器表达式并将生成的生成器对象传递给元组构造函数:

tuple(thing for thing in things)

或者,我们可以使用列表推导创建列表,然后将列表传递给元组构造函数:

tuple([thing for thing in things])

最后,与接受的答案相反,a more recent answer表示使用以下语法确实元组理解(自Python 3.5起):

*(thing for thing in things),
  • 对我来说,似乎第二个例子也是首先创建生成器对象的例子。它是否正确?

  • 这些表达方式在幕后发生的事情方面有什么不同吗?在性能方面?我假设第一个和第三个可能有延迟问题,而第二个可能有内存问题(如链接的注释中所讨论)。

  • 比较第一个和最后一个,哪一个更pythonic?

更新

正如预期的那样,列表理解确实要快得多。我不明白为什么第一个比第三个快。有什么想法吗?

>>> from timeit import timeit

>>> a = 'tuple(i for i in range(10000))'
>>> b = 'tuple([i for i in range(10000)])'
>>> c = '*(i for i in range(10000)),'

>>> print('A:', timeit(a, number=1000000))
>>> print('B:', timeit(b, number=1000000))
>>> print('C:', timeit(c, number=1000000))

A: 438.98362647295824
B: 271.7554752581845
C: 455.59842588083677

1 个答案:

答案 0 :(得分:1)

  

对我来说,似乎第二个例子也是一个发电机   首先创建对象。这是对的吗?

是的,你正确,检查CPython字节码:

>>> import dis
>>> dis.dis("*(thing for thing in thing),")
  1           0 LOAD_CONST               0 (<code object <genexpr> at 0x7f56e9347ed0, file "<dis>", line 1>)
              2 LOAD_CONST               1 ('<genexpr>')
              4 MAKE_FUNCTION            0
              6 LOAD_NAME                0 (thing)
              8 GET_ITER
             10 CALL_FUNCTION            1
             12 BUILD_TUPLE_UNPACK       1
             14 POP_TOP
             16 LOAD_CONST               2 (None)
             18 RETURN_VALUE
  

这些表达方式之间的区别是什么   在幕后继续?在性能方面?我假设第一个   第三个可能有延迟问题,而第二个可能有内存   问题(如链接评论中所述)。

我的时间安排表明前1个稍快一些,大概是因为通过BUILD_TUPLE_UNPACK解包比tuple()调用更贵:

>>> from timeit import timeit
>>> def f1(): tuple(thing for thing in range(100000))
... 
>>> def f2(): *(thing for thing in range(100000)),
... 
>>> timeit(lambda: f1(), number=100)
0.5535585517063737
>>> timeit(lambda: f2(), number=100)
0.6043887557461858
  

比较第一个和最后一个,哪一个更pythonic?

第一个看起来对我来说更具可读性,并且也适用于不同的Python版本。