假设我想创建一个将输入向量乘以输入矩阵的函数:
def MatMul(A,b):
return A.dot(b)
现在,我执行以下代码:
import numpy as np
A=np.array([[1,2,3],[4,5,6],[7,8,9]],dtype='float64')
b=np.array([4,5,6],dtype='float64')
c=np.zeros(3,dtype='float64')
c=MatMul(A,b)
MatMul
函数中是否还会有其他数组分配?我知道A
和b
将通过引用传递。请注意,我已经预分配了数组c
。
通常,如何避免像这样的简单函数中不必要的预分配?说,我要执行几个数学运算:
def Rank1Update(A,b,alpha):
c=A.dot(b)
c+=alpha*c.dot(c)*c
return c
我可以在一行中拟合许多数学函数,但是代码很快变得不可读。
我熟悉C风格的编程,为了避免不必要的内存分配,可以通过引用传递A
,b
和c
并在内部更新c
返回void
的函数。我可以在python中做同样的事情,但是为了方便和代码可读性,我想使用return
,
谢谢
米哈伊尔
答案 0 :(得分:2)
dot
不知道或不关心c
变量或该变量已持有引用的数组。它将创建一个新数组,=
会将c
变量绑定到该新数组,而旧的数组将由内存管理系统清除。
如果您希望dot
将输出存储到现有数组中,则需要告诉它这样做:
A.dot(b, out=c)
答案 1 :(得分:2)
Numpy在其产生新数组的大多数函数中,都有一个参数来存储结果数组。我在下面的代码中使用了该参数的名称版本out
,但是您可以忽略该名称。您必须确保out
数组具有正确的形状和dtype。此参数的目的正是您想要的-避免额外的内存分配。这也可以加快代码的速度。
import numpy as np
A = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]], dtype='float64')
b = np.array([4, 5, 6], dtype='float64')
c = np.zeros(3, dtype='float64')
A.dot(b, out=c)
documentation for dot()中提到了该参数。如果要更改功能MatMul
的定义,
def MatMul(A, b, c=None):
return A.dot(b, out=c)
并将呼叫更改为
MatMul(A, b, c)