哪个是在python中迭代列表的最有效方法?

时间:2012-06-07 10:09:57

标签: python performance list

说我有一个项目列表:

x = [1, 2, 3, 4, 5]

我需要为每个项目执行一些功能。在某种情况下,我需要返回一个项目的索引。

哪种方式最好,最有效?

for item in list:
    ....

for i in range(len(list)):
    ....

4 个答案:

答案 0 :(得分:15)

for item in list:

它显然是函数调用较少的那个。

如果您想要获取项目索引,请使用enumerate这样的

for pos, item in enumerate(collection):

答案 1 :(得分:13)

def loop_1(data):
    for i in range(len(data)):
        print(data[i])


def looper_2(data):
    for val in data:
        print(val)

使用dis进行检查为loop_1提供了以下字节码:

 12       0 SETUP_LOOP              40 (to 43)
          3 LOAD_GLOBAL              0 (range)
          6 LOAD_GLOBAL              1 (len)
          9 LOAD_FAST                0 (data)
         12 CALL_FUNCTION            1
         15 CALL_FUNCTION            1
         18 GET_ITER            
    >>   19 FOR_ITER                20 (to 42)
         22 STORE_FAST               1 (i)

13       25 LOAD_GLOBAL              2 (print)
         28 LOAD_FAST                0 (data)
         31 LOAD_FAST                1 (i)
         34 BINARY_SUBSCR       
         35 CALL_FUNCTION            1
         38 POP_TOP             
         39 JUMP_ABSOLUTE           19
    >>   42 POP_BLOCK           
    >>   43 LOAD_CONST               0 (None)
         46 RETURN_VALUE        

loop_2的字节码如下所示:

17        0 SETUP_LOOP              24 (to 27)
          3 LOAD_FAST                0 (data)
          6 GET_ITER            
    >>    7 FOR_ITER                16 (to 26)
         10 STORE_FAST               1 (val)

18       13 LOAD_GLOBAL              0 (print)
         16 LOAD_FAST                1 (val)
         19 CALL_FUNCTION            1
         22 POP_TOP             
         23 JUMP_ABSOLUTE            7
    >>   26 POP_BLOCK           
    >>   27 LOAD_CONST               0 (None)
         30 RETURN_VALUE

第二个版本显然更好。

答案 2 :(得分:4)

另一种可能的解决方案是使用numpy,这对于大型列表来说非常有效,可能比列表理解或for循环更有效。

import numpy as np

a = np.arange(5.0)   # a --> array([0., 1., 2., 3., 4.])

# numpy operates on arrays element by element 
#
b =3.*a              # b --> array([0., 3., 6., 9., 12.])

这是一个非常简单的操作,但是使用数组作为公式中的参数可以变得更复杂。对于大型数组,这可能比列表理解快得多,它使代码更清晰,更容易阅读(无需创建一个函数来映射列表解析)。您还可以使用索引和切片来定制您想要执行的操作:

如果您想要访问实际索引位置,请使用ndenumerate

# b is as above
for i, x in np.ndenumerate(b):
    print i, x

此for循环的输出为:

(0,) 0.0 
(1,) 3.0 
(2,) 6.0 
(3,) 9.0 
(4,) 12.0 

注意:索引由numpy作为元组返回以处理其他维度。这里我们只有一个维度,因此您必须解压缩元组以获取元素的索引。

答案 3 :(得分:3)

显然for i in range(len(list)):会慢一点 - 它等同于:

list2 = range(len(list))

for i in list2:
    ...

如果那个更快,那么这会更快,对吗?

list2 = range(len(list))
list3 = range(len(list2))
list4 = range(len(list3))

for i in list4:
    ...