据我了解,这两种方法都适用于对发电机中的每个项目进行操作:
i
成为我们的运营商目标my_iter
成为我们的发电机do_something_with
返回None
try:
while True:
i = next(my_iter)
do_something_with(i)
except StopIteration:
pass
for i in my_iter:
do_something_with(i)
[do_something_with(i) for i in my_iter]
次要编辑:print(i)
已替换为@kjiro建议的do_something_with(i)
,以解释使用解释器机制的用例。
据我所知,这些都是迭代生成器的适用方式,有没有理由偏爱另一个?
现在for循环看起来比我优越。由于:较少的线条/杂乱和一般的可读性,加上单个缩进。
如果你想在特定的异常情况下轻松打破循环,我真的只看到while方法是有利的。
答案 0 :(得分:5)
第三个选项最终 NOT 与前两个选项相同。第三个示例创建一个列表,每个列表对应print(i)
的返回值,恰好是None
,因此不是一个非常有趣的列表。
前两个在语义上相似。存在轻微的技术差异;如上所述,while循环不起作用,如果my_iter
不是,实际上是一个迭代器(即,有一个__next__()
方法);例如,如果它是list
。除了迭代器之外,for循环适用于所有迭代(具有__iter__()
方法)。
因此正确的版本是:
my_iter = iter(my_iterable)
try:
while True:
i = next(my_iter)
print(i)
except StopIteration:
pass
现在,除了可读性原因之外,实际上 是一个技术原因,你应该更喜欢for循环;对于在紧密内部循环中执行的字节码数量,你需要支付一个惩罚(在CPython中,无论如何)。让我们比较:
In [1]: def forloop(my_iter):
...: for i in my_iter:
...: print(i)
...:
In [57]: dis.dis(forloop)
2 0 SETUP_LOOP 24 (to 27)
3 LOAD_FAST 0 (my_iter)
6 GET_ITER
>> 7 FOR_ITER 16 (to 26)
10 STORE_FAST 1 (i)
3 13 LOAD_GLOBAL 0 (print)
16 LOAD_FAST 1 (i)
19 CALL_FUNCTION 1 (1 positional, 0 keyword pair)
22 POP_TOP
23 JUMP_ABSOLUTE 7
>> 26 POP_BLOCK
>> 27 LOAD_CONST 0 (None)
30 RETURN_VALUE
在内循环vs:
中调用的7个字节码In [55]: def whileloop(my_iterable):
....: my_iter = iter(my_iterable)
....: try:
....: while True:
....: i = next(my_iter)
....: print(i)
....: except StopIteration:
....: pass
....:
In [56]: dis.dis(whileloop)
2 0 LOAD_GLOBAL 0 (iter)
3 LOAD_FAST 0 (my_iterable)
6 CALL_FUNCTION 1 (1 positional, 0 keyword pair)
9 STORE_FAST 1 (my_iter)
3 12 SETUP_EXCEPT 32 (to 47)
4 15 SETUP_LOOP 25 (to 43)
5 >> 18 LOAD_GLOBAL 1 (next)
21 LOAD_FAST 1 (my_iter)
24 CALL_FUNCTION 1 (1 positional, 0 keyword pair)
27 STORE_FAST 2 (i)
6 30 LOAD_GLOBAL 2 (print)
33 LOAD_FAST 2 (i)
36 CALL_FUNCTION 1 (1 positional, 0 keyword pair)
39 POP_TOP
40 JUMP_ABSOLUTE 18
>> 43 POP_BLOCK
44 JUMP_FORWARD 18 (to 65)
7 >> 47 DUP_TOP
48 LOAD_GLOBAL 3 (StopIteration)
51 COMPARE_OP 10 (exception match)
54 POP_JUMP_IF_FALSE 64
57 POP_TOP
58 POP_TOP
59 POP_TOP
8 60 POP_EXCEPT
61 JUMP_FORWARD 1 (to 65)
>> 64 END_FINALLY
>> 65 LOAD_CONST 0 (None)
68 RETURN_VALUE
内循环中的9个字节码。
但是,我们实际上可以做得更好。In [58]: from collections import deque
In [59]: def deqloop(my_iter):
....: deque(map(print, my_iter), 0)
....:
In [61]: dis.dis(deqloop)
2 0 LOAD_GLOBAL 0 (deque)
3 LOAD_GLOBAL 1 (map)
6 LOAD_GLOBAL 2 (print)
9 LOAD_FAST 0 (my_iter)
12 CALL_FUNCTION 2 (2 positional, 0 keyword pair)
15 LOAD_CONST 1 (0)
18 CALL_FUNCTION 2 (2 positional, 0 keyword pair)
21 POP_TOP
22 LOAD_CONST 0 (None)
25 RETURN_VALUE
一切都在C中发生,collections.deque
,map
和print
都是内置的。 (对于cpython)所以在这种情况下,没有执行循环的字节码。当迭代步骤是c函数时,这只是一个有用的优化(就像print
的情况一样。否则,python函数调用的开销大于JUMP_ABSOLUTE
开销。
答案 1 :(得分:3)
for循环是最pythonic。请注意,您可以突破for循环以及while循环。
除非您需要结果列表,否则不要使用列表推导,否则您将不必要地存储所有元素。您的示例列表推导仅适用于Python 3中的print函数,它不适用于Python 2中的print语句。
答案 2 :(得分:1)
我同意你的看法for
循环优越。正如你所提到的,它不那么杂乱,而且阅读起来容易得多。程序员喜欢尽可能保持简单,for
循环就是这样做的。对于可能没有学过try/except
的新手Python程序员来说,它也更好。此外,正如Alasdair所提到的,你可以摆脱for循环。如果您使用列表,while
循环也会运行错误,除非您首先在iter()
上使用my_iter
。