Question

假设我想创建一个将输入向量乘以输入矩阵的函数：

def MatMul(A,b):
    return A.dot(b)

现在，我执行以下代码：

import numpy as np
A=np.array([[1,2,3],[4,5,6],[7,8,9]],dtype='float64')
b=np.array([4,5,6],dtype='float64')
c=np.zeros(3,dtype='float64')
c=MatMul(A,b)

MatMul函数中是否还会有其他数组分配？我知道A和b将通过引用传递。请注意，我已经预分配了数组c。

通常，如何避免像这样的简单函数中不必要的预分配？说，我要执行几个数学运算：

def Rank1Update(A,b,alpha):
    c=A.dot(b)
    c+=alpha*c.dot(c)*c
    return c

我可以在一行中拟合许多数学函数，但是代码很快变得不可读。

我熟悉C风格的编程，为了避免不必要的内存分配，可以通过引用传递A，b和c并在内部更新c返回void的函数。我可以在python中做同样的事情，但是为了方便和代码可读性，我想使用return，

谢谢

米哈伊尔

Answer 1

dot不知道或不关心c变量或该变量已持有引用的数组。它将创建一个新数组，=会将c变量绑定到该新数组，而旧的数组将由内存管理系统清除。

如果您希望dot将输出存储到现有数组中，则需要告诉它这样做：

A.dot(b, out=c)

Answer 2

Numpy在其产生新数组的大多数函数中，都有一个参数来存储结果数组。我在下面的代码中使用了该参数的名称版本out，但是您可以忽略该名称。您必须确保out数组具有正确的形状和dtype。此参数的目的正是您想要的-避免额外的内存分配。这也可以加快代码的速度。

import numpy as np
A = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]], dtype='float64')
b = np.array([4, 5, 6], dtype='float64')
c = np.zeros(3, dtype='float64')

A.dot(b, out=c)

documentation for dot()中提到了该参数。如果要更改功能MatMul的定义，

def MatMul(A, b, c=None):
    return A.dot(b, out=c)

并将呼叫更改为

MatMul(A, b, c)

Python函数：返回没有额外内存分配的数组

2 个答案: