我有一个2D矩阵,我想采取每一行的规范。但是当我直接使用numpy.linalg.norm(X)
时,它需要整个矩阵的范数。
我可以通过使用for循环然后取每个X[i]
的范数来获取每一行的范数,但是因为我有30k行所以需要很长时间。
有什么建议可以找到更快的方法吗?或者是否可以将np.linalg.norm
应用于矩阵的每一行?
答案 0 :(得分:74)
请注意,作为perimosocordiae shows,从NumPy版本1.9开始,np.linalg.norm(x, axis=1)
是计算L2范数的最快方法。
如果您正在计算L2范数,则可以直接计算它(使用axis=-1
参数沿行求和):
np.sum(np.abs(x)**2,axis=-1)**(1./2)
Lp-norms当然可以类似地计算。
它比np.apply_along_axis
快得多,但可能不那么方便:
In [48]: %timeit np.apply_along_axis(np.linalg.norm, 1, x)
1000 loops, best of 3: 208 us per loop
In [49]: %timeit np.sum(np.abs(x)**2,axis=-1)**(1./2)
100000 loops, best of 3: 18.3 us per loop
其他ord
形式的norm
也可以直接计算(具有相似的加速比):
In [55]: %timeit np.apply_along_axis(lambda row:np.linalg.norm(row,ord=1), 1, x)
1000 loops, best of 3: 203 us per loop
In [54]: %timeit np.sum(abs(x), axis=-1)
100000 loops, best of 3: 10.9 us per loop
答案 1 :(得分:44)
由于numpy更新而重新提出旧问题。从1.9版本开始,numpy.linalg.norm
现在接受axis
参数。 [code,documentation]
这是镇上最快的方法:
In [10]: x = np.random.random((500,500))
In [11]: %timeit np.apply_along_axis(np.linalg.norm, 1, x)
10 loops, best of 3: 21 ms per loop
In [12]: %timeit np.sum(np.abs(x)**2,axis=-1)**(1./2)
100 loops, best of 3: 2.6 ms per loop
In [13]: %timeit np.linalg.norm(x, axis=1)
1000 loops, best of 3: 1.4 ms per loop
并证明它正在计算同样的事情:
In [14]: np.allclose(np.linalg.norm(x, axis=1), np.sum(np.abs(x)**2,axis=-1)**(1./2))
Out[14]: True
答案 2 :(得分:10)
比接受的答案快得多
numpy.sqrt(numpy.einsum('ij,ij->i', a, a))
请注意对数刻度:
重现情节的代码:
import numpy
import perfplot
def sum_sqrt(a):
return numpy.sqrt(numpy.sum(numpy.abs(a)**2, axis=-1))
def apply_norm_along_axis(a):
return numpy.apply_along_axis(numpy.linalg.norm, 1, a)
def norm_axis(a):
return numpy.linalg.norm(a, axis=1)
def einsum_sqrt(a):
return numpy.sqrt(numpy.einsum('ij,ij->i', a, a))
perfplot.show(
setup=lambda n: numpy.random.rand(n, 3),
kernels=[sum_sqrt, apply_norm_along_axis, norm_axis, einsum_sqrt],
n_range=[2**k for k in range(20)],
logx=True,
logy=True,
xlabel='len(a)'
)
答案 3 :(得分:6)
尝试以下方法:
In [16]: numpy.apply_along_axis(numpy.linalg.norm, 1, a)
Out[16]: array([ 5.38516481, 1.41421356, 5.38516481])
其中a
是您的2D数组。
以上计算了L2规范。对于不同的规范,您可以使用以下内容:
In [22]: numpy.apply_along_axis(lambda row:numpy.linalg.norm(row,ord=1), 1, a)
Out[22]: array([9, 2, 9])