大多数Pythonic方法将这两个向量相乘?

时间:2018-06-08 16:40:01

标签: python numpy vectorization

我有两个大小的矢量:

A = (32,512,640)

B = (4,512)

我需要将A和B相乘,以便得到一个新的向量:

C = (4,32,512,640)

另一种思考方式是向量B的每一行沿着A的轴= -2相乘,这导致一个新的1,32,512,640立方体。 B的每一行都可以循环形成1,32,512,640个立方体,然后可以使用np.concatenatenp.vstack来构建C,例如:

# Sample vectors, where the dimensions aren't necessarily known
a = np.arange(32*512*465, dtype='f4').reshape((32,512,465))
b = np.ones((4,512), dtype='f4')

# Using a loop
d = []
for row in b:
    d.append(np.expand_dims(row[None,:,None]*a, axis=0))

# Or using list comprehension
d = [np.expand_dims(row[None,:,None]*a,axis=0) for row in b]

# Stacking the final list
result = np.vstack(d)

但我想知道是否可以使用像np.einsumnp.tensordot之类的东西来将这个矢量化全部放在一行中。我还在学习如何使用这两种方法,所以我不确定它是否合适。

谢谢!

1 个答案:

答案 0 :(得分:7)

在使用broadcasting扩展B的维度后,我们可以利用None/np.newaxis -

C = A * B[:,None,:,None]

使用einsum,它将是 -

C = np.einsum('ijk,lj->lijk',A,B)

这里没有减少总和,所以einsum不会比explicit-broadcasting更好。但是,既然我们正在寻找可以使用的Pythonic解决方案,一旦我们通过它的字符串表示法。

让我们来完成一些事情 -

In [15]: m,n,r,p = 32,512,640,4
    ...: A = np.random.rand(m,n,r)
    ...: B = np.random.rand(p,n)

In [16]: %timeit A * B[:,None,:,None]
10 loops, best of 3: 80.9 ms per loop

In [17]: %timeit np.einsum('ijk,lj->lijk',A,B)
10 loops, best of 3: 109 ms per loop

# Original soln
In [18]: %%timeit
    ...: d = []
    ...: for row in B:
    ...:     d.append(np.expand_dims(row[None,:,None]*A, axis=0))
    ...: 
    ...: result = np.vstack(d)
10 loops, best of 3: 130 ms per loop

利用multi-core

我们可以利用适用于arithmetic operationslarge data的{​​{3}},从而在这里获得一些性能提升。让我们一起来吧 -

In [42]: import numexpr as ne

In [43]: B4D = B[:,None,:,None] # this is virtually free

In [44]: %timeit ne.evaluate('A*B4D')
10 loops, best of 3: 64.6 ms per loop

单行:ne.evaluate('A*B4D',{'A':A,'B4D' :B[:,None,:,None]})

multi-core capability of numexpr关于如何控制多核功能。