Question

我有矢量a 我想计算np.inner(a, a)
但我想知道是否有更好的方法来计算它。

[这种方式的缺点是，如果我想为a-b或更复杂的表达式计算它，我必须再做一行。 c = a - b和np.inner(c, c)代替somewhat(a - b)]

Answer 1

计算norm2

numpy.linalg.norm(x, ord=2)

numpy.linalg.norm(x, ord=2)**2为方

Answer 2

我不知道性能是否有用，但(a**2).sum()计算正确的值并且具有您想要的非重复参数。您可以将a替换为一些复杂的表达式而不将其绑定到变量，只需记住在必要时使用括号，因为**比大多数其他运算符绑定得更紧密：((a-b)**2).sum()

Answer 3

老实说，可能没有比np.inner或np.dot更快的速度。如果你发现中间变量很烦人，你总是可以创建一个lambda函数：

sqeuclidean = lambda x: np.inner(x, x)

np.inner和np.dot利用BLAS例程，几乎肯定比标准元素乘法更快，然后求和。

In [1]: %%timeit -n 1 -r 100 a, b = np.random.randn(2, 1000000)
((a - b) ** 2).sum()
   ....: 
The slowest run took 36.13 times longer than the fastest. This could mean that an intermediate result is being cached 
1 loops, best of 100: 6.45 ms per loop

In [2]: %%timeit -n 1 -r 100 a, b = np.random.randn(2, 1000000)                                                                                                                                                                              
np.linalg.norm(a - b, ord=2) ** 2
   ....: 
1 loops, best of 100: 2.74 ms per loop

In [3]: %%timeit -n 1 -r 100 a, b = np.random.randn(2, 1000000)
sqeuclidean(a - b)
   ....: 
1 loops, best of 100: 2.64 ms per loop

np.linalg.norm(..., ord=2)在内部使用np.dot，并且与直接使用np.inner的效果非常相似。

Answer 4

如果您最终在这里寻找一种快速的方法来获得平方范数，则这些测试表明distances = np.sum((descriptors - desc[None])**2, axis=1)是最快的。

import timeit

setup_code = """
import numpy as np
descriptors = np.random.rand(3000, 512)
desc = np.random.rand(512)
"""

norm_code = """
np.linalg.norm(descriptors - desc[None], axis=-1)
"""
norm_time = timeit.timeit(stmt=norm_code, setup=setup_code, number=100, )

einsum_code = """
x = descriptors - desc[None]
sqrd_dist = np.einsum('ij,ij -> i', x, x)
"""
einsum_time = timeit.timeit(stmt=einsum_code, setup=setup_code, number=100, )

norm_sqrd_code = """
distances = np.sum((descriptors - desc[None])**2, axis=1)
"""
norm_sqrd_time = timeit.timeit(stmt=norm_sqrd_code, setup=setup_code, number=100, )

print(norm_time) # 0.7688689678907394
print(einsum_time) # 0.29194538854062557
print(norm_sqrd_time) # 0.274090813472867

NumPy计算向量

4 个答案: