python`for i in iter` vs`on True;我=下一个(iter)`

时间:2015-01-03 23:46:00

标签: python iteration

据我了解,这两种方法都适用于对发电机中的每个项目进行操作:

  • i成为我们的运营商目标
  • my_iter成为我们的发电机
  • 让callable do_something_with返回None

While Loop + StopIteratioon

try:
    while True:
        i = next(my_iter)
        do_something_with(i)
except StopIteration:
    pass

用于循环/列表理解

for i in my_iter:
    do_something_with(i)

[do_something_with(i) for i in my_iter]

次要编辑:print(i)已替换为@kjiro建议的do_something_with(i),以解释使用解释器机制的用例。


据我所知,这些都是迭代生成器的适用方式,有没有理由偏爱另一个?

现在for循环看起来比我优越。由于:较少的线条/杂乱和一般的可读性,加上单个缩进。

如果你想在特定的异常情况下轻松打破循环,我真的只看到while方法是有利的。

3 个答案:

答案 0 :(得分:5)

第三个选项最终 NOT 与前两个选项相同。第三个示例创建一个列表,每个列表对应print(i)的返回值,恰好是None,因此不是一个非常有趣的列表。

前两个在语义上相似。存在轻微的技术差异;如上所述,while循环不起作用,如果my_iter不是,实际上是一个迭代器(即,有一个__next__()方法);例如,如果它是list。除了迭代器之外,for循环适用于所有迭代(具有__iter__()方法)。

因此正确的版本是:

my_iter = iter(my_iterable)
try:
    while True:
        i = next(my_iter)
        print(i)
except StopIteration:
    pass

现在,除了可读性原因之外,实际上 是一个技术原因,你应该更喜欢for循环;对于在紧密内部循环中执行的字节码数量,你需要支付一个惩罚(在CPython中,无论如何)。让我们比较:

In [1]: def forloop(my_iter):
   ...:     for i in my_iter:
   ...:         print(i)
   ...:         

In [57]: dis.dis(forloop)
  2           0 SETUP_LOOP              24 (to 27)
              3 LOAD_FAST                0 (my_iter)
              6 GET_ITER
        >>    7 FOR_ITER                16 (to 26)
             10 STORE_FAST               1 (i)

  3          13 LOAD_GLOBAL              0 (print)
             16 LOAD_FAST                1 (i)
             19 CALL_FUNCTION            1 (1 positional, 0 keyword pair)
             22 POP_TOP
             23 JUMP_ABSOLUTE            7
        >>   26 POP_BLOCK
        >>   27 LOAD_CONST               0 (None)
             30 RETURN_VALUE

在内循环vs:

中调用的7个字节码
In [55]: def whileloop(my_iterable):
   ....:     my_iter = iter(my_iterable)
   ....:     try:
   ....:         while True:
   ....:             i = next(my_iter)
   ....:             print(i)
   ....:     except StopIteration:
   ....:         pass
   ....:     

In [56]: dis.dis(whileloop)
  2           0 LOAD_GLOBAL              0 (iter)
              3 LOAD_FAST                0 (my_iterable)
              6 CALL_FUNCTION            1 (1 positional, 0 keyword pair)
              9 STORE_FAST               1 (my_iter)

  3          12 SETUP_EXCEPT            32 (to 47)

  4          15 SETUP_LOOP              25 (to 43)

  5     >>   18 LOAD_GLOBAL              1 (next)
             21 LOAD_FAST                1 (my_iter)
             24 CALL_FUNCTION            1 (1 positional, 0 keyword pair)
             27 STORE_FAST               2 (i)

  6          30 LOAD_GLOBAL              2 (print)
             33 LOAD_FAST                2 (i)
             36 CALL_FUNCTION            1 (1 positional, 0 keyword pair)
             39 POP_TOP
             40 JUMP_ABSOLUTE           18
        >>   43 POP_BLOCK
             44 JUMP_FORWARD            18 (to 65)

  7     >>   47 DUP_TOP
             48 LOAD_GLOBAL              3 (StopIteration)
             51 COMPARE_OP              10 (exception match)
             54 POP_JUMP_IF_FALSE       64
             57 POP_TOP
             58 POP_TOP
             59 POP_TOP

  8          60 POP_EXCEPT
             61 JUMP_FORWARD             1 (to 65)
        >>   64 END_FINALLY
        >>   65 LOAD_CONST               0 (None)
             68 RETURN_VALUE

内循环中的9个字节码。

但是,我们实际上可以做得更好。

In [58]: from collections import deque

In [59]: def deqloop(my_iter):
   ....:     deque(map(print, my_iter), 0)
   ....:     

In [61]: dis.dis(deqloop)
  2           0 LOAD_GLOBAL              0 (deque)
              3 LOAD_GLOBAL              1 (map)
              6 LOAD_GLOBAL              2 (print)
              9 LOAD_FAST                0 (my_iter)
             12 CALL_FUNCTION            2 (2 positional, 0 keyword pair)
             15 LOAD_CONST               1 (0)
             18 CALL_FUNCTION            2 (2 positional, 0 keyword pair)
             21 POP_TOP
             22 LOAD_CONST               0 (None)
             25 RETURN_VALUE

一切都在C中发生,collections.dequemapprint都是内置的。 (对于cpython)所以在这种情况下,没有执行循环的字节码。当迭代步骤是c函数时,这只是一个有用的优化(就像print的情况一样。否则,python函数调用的开销大于JUMP_ABSOLUTE开销。

答案 1 :(得分:3)

for循环是最pythonic。请注意,您可以突破for循环以及while循环。

除非您需要结果列表,否则不要使用列表推导,否则您将不必要地存储所有元素。您的示例列表推导仅适用于Python 3中的print函数,它不适用于Python 2中的print语句。

答案 2 :(得分:1)

我同意你的看法for循环优越。正如你所提到的,它不那么杂乱,而且阅读起来容易得多。程序员喜欢尽可能保持简单,for循环就是这样做的。对于可能没有学过try/except的新手Python程序员来说,它也更好。此外,正如Alasdair所提到的,你可以摆脱for循环。如果您使用列表,while循环也会运行错误,除非您首先在iter()上使用my_iter