numpy.einsum的更快替代方案,用于获取两个向量列表的“元素方式”点积?

时间:2014-06-16 06:21:08

标签: python numpy

让我们说你给了两个向量数组:

v1 = np.array([ [1, 2], [3, 4] ]) v2 = np.array([ [10, 20], [30, 40]])

我们希望生成一个等同于:

的数组

v3 = np.array([ np.dot(v1[0], v2[0]), np.dot(v1[1], v2[1]) ])

目前我使用:

v3 = np.einsum('ij,ij->i', v1, v2)

但是,我在我的代码中执行了很多 ,所以这里的速度对我来说非常有用。

我们怎样才能加快速度? np.einsum已经非常有效了,但我想知道对于这个特定的用例,还有更快的方法吗?

2 个答案:

答案 0 :(得分:2)

einsum在我能想到的3个选项中做得最好:

In [73]: timeit v3=np.einsum('ij,ij->i',v1,v2)
100000 loops, best of 3: 5.14 us per loop

In [74]: timeit np.diag(np.dot(v1,v2.T))
100000 loops, best of 3: 7.43 us per loop

In [75]: timeit np.sum(v1*v2,axis=1)
100000 loops, best of 3: 16.8 us per loop

要问几个问题:

  • 这个计算真的那么贵吗?
  • 如果它相对昂贵你经常这样做吗?
  • 你能整合einsum调用 - 连接数组吗?

答案 1 :(得分:1)

尝试inner1d

import numpy as np
import cProfile
from numpy.core.umath_tests import inner1d

v1 = np.random.random((10**7,2,))  # 10 million random vectors
v2 = np.random.random((10**7,2,))  # 10 million random vectors
v3 = np.einsum('ij,ij->i', v1, v2) # einsum
v4 = inner1d(v1,v2)                # inner1d (~2x faster than einsum)

cProfile.run("np.einsum('ij,ij->i', v1, v2)") # cProfile: 3 function calls in 0.065 seconds
cProfile.run("inner1d(v1,v2)") # cProfile: 2 function calls in 0.033 seconds

print np.allclose(v3,v4) # Returns True