Python:优化循环

时间:2013-07-18 14:50:16

标签: python loops numpy

我希望优化一些由两个嵌套循环组成的python代码。我对numpy并不那么熟悉,但据我所知,它应该能够帮助我提高这项任务的效率。下面是我编写的测试代码,它反映了实际代码中发生的情况。目前使用numpy范围和迭代器比通常的python更慢。我究竟做错了什么?这个问题的最佳解决方案是什么?

感谢您的帮助!

import numpy
import time

# setup a problem analagous to that in the real code
npoints_per_plane = 1000
nplanes = 64
naxis = 1000
npoints3d = naxis + npoints_per_plane * nplanes
npoints = naxis + npoints_per_plane
specres = 1000

# this is where the data is being mapped to
sol = dict()
sol["ems"] = numpy.zeros(npoints3d)
sol["abs"] = numpy.zeros(npoints3d)

# this would normally be non-random input data
data = dict()
data["ems"] = numpy.zeros((npoints,specres))
data["abs"] = numpy.zeros((npoints,specres))
for ip in range(npoints):
    data["ems"][ip,:] = numpy.random.random(specres)[:]
    data["abs"][ip,:] = numpy.random.random(specres)[:]
ems_mod = numpy.random.random(1)[0]
abs_mod = numpy.random.random(1)[0]
ispec = numpy.random.randint(specres)

# this the code I want to optimize

t0 = time.time()

# usual python range and iterator
for ip in range(npoints_per_plane):
    jp = naxis + ip
    for ipl in range(nplanes):
        ip3d = jp + npoints_per_plane * ipl
        sol["ems"][ip3d] = data["ems"][jp,ispec] * ems_mod
        sol["abs"][ip3d] = data["abs"][jp,ispec] * abs_mod

t1 = time.time()

# numpy ranges and iterator
ip_vals = numpy.arange(npoints_per_plane)
ipl_vals = numpy.arange(nplanes)
for ip in numpy.nditer(ip_vals):
    jp = naxis + ip
    for ipl in numpy.nditer(ipl_vals):
        ip3d = jp + npoints_per_plane * ipl
        sol["ems"][ip3d] = data["ems"][jp,ispec] * ems_mod
        sol["abs"][ip3d] = data["abs"][jp,ispec] * abs_mod


t2 = time.time()

print "plain python: %0.3f seconds" % ( t1 - t0 )
print "numpy: %0.3f seconds" % ( t2 - t1 )

编辑:在第一个for循环中放入“jp = naxis + ip”

补充说明:

我弄清楚如何快速完成内循环,而不是外循环:

# numpy vectorization
for ip in xrange(npoints_per_plane):
    jp = naxis + ip
    sol["ems"][jp:jp+npoints_per_plane*nplanes:npoints_per_plane] = data["ems"][jp,ispec] * ems_mod
    sol["abs"][jp:jp+npoints_per_plane*nplanes:npoints_per_plane] = data["abs"][jp,ispec] * abs_mod

Joe的解决方案显示了如何一起完成这两项工作,谢谢!

1 个答案:

答案 0 :(得分:6)

在numpy中编写循环的最佳方法是编写循环,而是使用矢量化操作。例如:

c = 0
for i in range(len(a)):
    c += a[i] + b[i]

变为

c = np.sum(a + b, axis=0)

对于形状为a的{​​{1}}和b,第一个版本需要0.344秒,第二个版本需要0.062秒。

在您的问题中提供的案例中,以下内容符合您的要求:

(100000, 100)

这可以使用some tricks进一步优化,但这会降低清晰度,可能是因为过早优化:

  

普通python:0.064秒

     

numpy:0.002秒

解决方案的工作原理如下:

您的原始版本包含sol['ems'][naxis:] = numpy.ravel( numpy.repeat( data['ems'][naxis:,ispec,numpy.newaxis] * ems_mod, nplanes, axis=1 ), order='F' ) ,它只是跳过第一个jp = naxis + ip元素naxis选择除第一个naxis元素之外的所有元素。你的内循环在[naxis:]次重复data[jp,ispec]的值并将其写入多个位置nplanes,这相当于由ip3d = jp + npoints_per_plane * ipl偏移的扁平2D数组。因此,第二个维度通过naxis添加到(之前的1D)numpy.newaxis,通过data['ems'][naxis:, ispec]沿着此新维度重复nplanes次。然后通过numpy.repeat(以Fortran顺序,即最低轴具有最小步幅)再次展平所得到的2D阵列,并将其写入适当的numpy.ravel子阵列。如果目标数组实际上是2D,则可以使用自动数组广播跳过重复。

如果遇到无法避免使用循环的情况,可以使用Cython(在numpy数组上支持efficient buffer views)。