如何限制Python中循环的迭代?

时间:2016-03-19 20:22:48

标签: python enumerate

说我有一个项目列表,我想迭代它的前几个:

items = list(range(10)) # I mean this to represent any kind of iterable.
limit = 5

天真的实施

来自其他语言的Pythonnïf可能会编写这个完全可用且性能良好(如果是单一的)代码:

index = 0
for item in items: # Python's `for` loop is a for-each.
    print(item)    # or whatever function of that item.
    index += 1
    if index == limit:
        break

更多惯用实现

但Python已经枚举,它很好地包含了大约一半的代码:

for index, item in enumerate(items):
    print(item)
    if index == limit: # There's gotta be a better way.
        break

所以我们要把额外的代码减少一半。但是必须有一个更好的方法。

我们可以近似下面的伪代码行为吗?

如果enumerate采用了另一个可选的stop参数(例如,它需要start这样的参数:enumerate(items, start=1)),我认为这是理想的,但下面没有'存在(参见documentation on enumerate here):

# hypothetical code, not implemented:
for _, item in enumerate(items, start=0, stop=limit): # `stop` not implemented
    print(item)

请注意,无需为index命名,因为无需引用它。

是否有一种惯用的方式来写上述内容?怎么样?

第二个问题:为什么这不是枚举的?

6 个答案:

答案 0 :(得分:61)

  

如何限制Python中循环的迭代?

for index, item in enumerate(items):
    print(item)
    if index == limit:
        break
     

是否有一种较短的,惯用的方式来编写上述内容?怎么样?

包括索引

zip在其参数的最短迭代次数上停止。 (与zip_longest的行为相反,后者使用最长的可迭代。)

range可以提供有限的迭代,我们可以将其与主要的可迭代文件一起传递。

因此我们可以将range对象(带有stop参数)传递给zip,并像有限的枚举一样使用它。

zip(range(limit), items)

使用Python 3,ziprange返回iterables,它们管理数据,而不是在列表中实现中间步骤的数据。

for index, item in zip(range(limit), items):
    print(index, item)

要在Python 2中获得相同的行为,只需将xrange替换为range,将itertools.izip替换为zip

from itertools import izip
for index, item in izip(xrange(limit), items):
    print(item)

如果不需要索引,itertools.islice

您可以使用itertools.islice

for item in itertools.islice(items, 0, stop):
    print(item)

,不需要分配索引。

撰写enumerate(islice(items, stop))以获取索引

正如Pablo Ruiz Ruiz指出的那样,我们也可以用枚举来组成islice。

for index, item in enumerate(islice(items, limit)):
    print(index, item)
  

为什么不将其内置到enumerate

这里是用纯Python实现的枚举(可能修改以在注释中获得所需的行为):

def enumerate(collection, start=0):  # could add stop=None
    i = start
    it = iter(collection)
    while 1:                         # could modify to `while i != stop:`
        yield (i, next(it))
        i += 1

对于那些已经使用枚举的人来说,上述性能会降低,因为它必须检查是否是时候停止每次迭代了。如果没有得到停止参数,我们可以检查并使用旧的枚举:

_enumerate = enumerate

def enumerate(collection, start=0, stop=None):
    if stop is not None:
        return zip(range(start, stop), collection)
    return _enumerate(collection, start)

这种额外检查对性能的影响可以忽略不计。

至于为什么枚举没有停止参数,这是最初提出的(见PEP 279):

  

此功能最初是在可选的启动时提出的       并停止参数。 GvR [Guido van Rossum]指出函数调用       enumerate(seqn, 4, 6)有另一种似是而非的解释       一个切片,它将返回第四个和第五个元素       序列。为了避免歧义,可选参数是       即使这意味着失去作为循环计数器的灵活性,也会掉线       这种灵活性对于普通案例来说是最重要的       从一个算起,如:

for linenum, line in enumerate(source,1):  print linenum, line

显然start被保留了,因为它非常有价值,stop被删除了,因为它使用案例较少,并且导致了对新功能使用的混淆。

避免使用下标符号切片

另一个答案是:

  

为什么不简单地使用

for item in items[:limit]: # or limit+1, depends

以下是一些缺点:

  • 它仅适用于接受切片的迭代,因此它更受限制。
  • 如果他们确实接受切片,它通常会在内存中创建一个新的数据结构,而不是遍历参考数据结构,因此会浪费内存(所有内置对象在切片时都会复制,但是,例如,numpy数组会产生一个切片时查看。)
  • 不可思议的迭代可能需要其他类型的处理。如果切换到惰性评估模型,则还必须使用切片更改代码。

当您了解限制以及是否制作副本或视图时,您应该只使用下标符号切片。

结论

我认为现在Python社区知道枚举的用法,混淆成本会超过参数的值。

在此之前,您可以使用:

for index, element in zip(range(limit), items):
    ...

for index, item in enumerate(islice(items, limit)):
    ...

或者,如果您根本不需要索引:

for element in islice(items, 0, limit):
    ...

除非您了解限制,否则请避免使用下标符号进行切片。

答案 1 :(得分:20)

您可以使用itertools.islice。它接受startstopstep个参数,如果您只传递一个参数,则它被视为stop。它适用于任何可迭代的。

itertools.islice(iterable, stop)
itertools.islice(iterable, start, stop[, step])

<强>演示:

>>> from itertools import islice
>>> items = list(range(10))
>>> limit = 5
>>> for item in islice(items, limit):
    print item,
...
0 1 2 3 4

docs中的示例:

islice('ABCDEFG', 2) --> A B
islice('ABCDEFG', 2, 4) --> C D
islice('ABCDEFG', 2, None) --> C D E F G
islice('ABCDEFG', 0, None, 2) --> A C E G

答案 2 :(得分:18)

为什么不简单地使用

for item in items[:limit]: # or limit+1, depends
    print(item)    # or whatever function of that item.

这仅适用于某些迭代,但由于您指定了列表,因此可以使用。

如果您使用集合或词组等,它不起作用。

答案 3 :(得分:1)

通过islice并枚举其内部限制

a = [2,3,4,2,1,4]

for a, v in enumerate(islice(a, 3)): 
   print(a, v)

输出:

0 2
1 3
2 4

答案 4 :(得分:1)

为什么不循环直到列表的限制或结尾(以较早发生者为准),

items = range(10)
limit = 5
for i in range(min(limit, len(items))):
  print items[i]

输出:

0
1
2
3
4

答案 5 :(得分:-2)

简短解决方案

items = range(10)
limit = 5

for i in items[:limit]: print(i)