矢量化代码与numpy中的标准循环的结果不同

时间:2016-04-30 08:22:46

标签: python python-2.7 numpy

我有以下两个功能:

def loop(x):
    a = np.zeros(10)
    for i1 in range(10):
        for i2 in range(10):
            a[i1] += np.sin(x[i2] - x[i1])
    return a

def vectorized(x):    
    b = np.zeros(10)
    for i1 in range(10):
        b += np.sin(np.roll(x, i1) - x)
    return b

然而,当我同时运行时,我发现它们的结果略有不同:

x = np.arange(10)
a, b = loop(x), vectorized(x)
print b - a

我明白了:

[  2.22044605e-16   0.00000000e+00   0.00000000e+00   6.66133815e-16
  -2.22044605e-16   2.22044605e-16   0.00000000e+00   2.22044605e-16
   2.22044605e-16   2.22044605e-16]

这个非常小,但就我而言,会影响模拟。如果我从函数中删除np.sin,差异就会消失。或者,如果对x使用np.float32,差异也会消失,但这是使用float64的解算器解决的ode的一部分。有没有办法解决这个差异?

1 个答案:

答案 0 :(得分:5)

这是因为你没有以相同的顺序进行操作。

对于等效的完全向量解决方案,请执行c=sin(add.outer(x,-x))).sum(axis=0)

In [8]: (c==loop(x)).all()
Out[8]: True

你赢得了矢量化的全部优势:

In [9]: %timeit loop(x)
1000 loops, best of 3: 750 µs per loop

In [10]: %timeit vectorized(x)
1000 loops, best of 3: 347 µs per loop

In [11]: %timeit sin(x[:,None]-x).sum(axis=0)
10000 loops, best of 3: 46 µs per loop