Numpy

时间:2016-05-06 14:06:16

标签: python performance numpy scipy vectorization

假设我有一个n x m矩阵,并希望在每个元素上调用一个函数fct。我可以这样做:

A = numpy.array(...)
vec_func = numpy.vectorize(fct)
A_out = vec_func(A)

这将严格应用于每个矩阵元素的函数,fct将是一个函数:

def fct(a_ij):
  # do something with matrix element a(i, j)

现在我也喜欢这样,但对于矩阵的每一行:

def fct(row_i):
  # do something with matrix row(i)

有没有办法用numpy.vectorize或类似的方式做到?

1 个答案:

答案 0 :(得分:1)

编辑:np.apply_along_axis看起来像你想要的那样。例如:

import numpy as np

def f(x):
    return x * x.sum()

X = np.arange(12).reshape(2, 2, 3)
np.apply_along_axis(f, -1, X)
# array([[[  0,   3,   6],
#         [ 36,  48,  60]],
#
#        [[126, 147, 168],
#         [270, 300, 330]]])

以下原始回复中的效果说明仍然适用。

原始回复:

没有内置功能,但Python可以直接自己定义这样的上下文管理器。例如:

import numpy as np
from contextlib import wraps

def row_vectorize(f):
    @wraps(f)
    def wrapped_f(X):
        X = np.asarray(X)
        rows = X.reshape(-1, X.shape[-1])
        return np.reshape([f(row) for row in rows],
                          X.shape[:-1] + (-1,))
    return wrapped_f


@row_vectorize
def func(row):
    return row * row.sum()

现在你可以在任何非零维度的数组上使用它:

>>> X_1D = np.arange(3)
>>> func(X_1D)
array([0, 3, 6])

>>> X_2D = np.arange(6).reshape(2, 3)
>>> func(X_2D)
array([[ 0,  3,  6],
       [36, 48, 60]])

>>> X_3D = np.arange(12).reshape((2, 2, 3))
>>> func(X_3D)
array([[[  0,   3,   6],
        [ 36,  48,  60]],

       [[126, 147, 168],
        [270, 300, 330]]])

在性能方面,np.vectorize正在做一些非常相似的事情。

如果您需要更快地循环应用于数组的自定义函数,您通常可以根据numpy元素操作和聚合操作来构造方法;例如,此函数完成与上面的行向量化函数相同的操作,但在大输入上会更快:

def func2(X):
    return X * X.sum(-1, keepdims=True)

如果你有一个更复杂的操作,你想跨数组的行应用并且循环的性能是一个瓶颈,最好的选择可能是使用numbacython