Python函数:返回没有额外内存分配的数组

时间:2018-07-25 20:28:13

标签: python function numpy pass-by-reference

假设我想创建一个将输入向量乘以输入矩阵的函数:

def MatMul(A,b):
    return A.dot(b)

现在,我执行以下代码:

import numpy as np
A=np.array([[1,2,3],[4,5,6],[7,8,9]],dtype='float64')
b=np.array([4,5,6],dtype='float64')
c=np.zeros(3,dtype='float64')
c=MatMul(A,b)

MatMul函数中是否还会有其他数组分配?我知道Ab将通过引用传递。请注意,我已经预分配了数组c

通常,如何避免像这样的简单函数中不必要的预分配?说,我要执行几个数学运算:

def Rank1Update(A,b,alpha):
    c=A.dot(b)
    c+=alpha*c.dot(c)*c
    return c

我可以在一行中拟合许多数学函数,但是代码很快变得不可读。

我熟悉C风格的编程,为了避免不必要的内存分配,可以通过引用传递Abc并在内部更新c返回void的函数。我可以在python中做同样的事情,但是为了方便和代码可读性,我想使用return

谢谢

米哈伊尔

2 个答案:

答案 0 :(得分:2)

dot不知道或不关心c变量或该变量已持有引用的数组。它将创建一个新数组,=会将c变量绑定到该新数组,而旧的数组将由内存管理系统清除。

如果您希望dot将输出存储到现有数组中,则需要告诉它这样做:

A.dot(b, out=c)

答案 1 :(得分:2)

Numpy在其产生新数组的大多数函数中,都有一个参数来存储结果数组。我在下面的代码中使用了该参数的名称版本out,但是您可以忽略该名称。您必须确保out数组具有正确的形状和dtype。此参数的目的正是您想要的-避免额外的内存分配。这也可以加快代码的速度。

import numpy as np
A = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]], dtype='float64')
b = np.array([4, 5, 6], dtype='float64')
c = np.zeros(3, dtype='float64')

A.dot(b, out=c)

documentation for dot()中提到了该参数。如果要更改功能MatMul的定义,

def MatMul(A, b, c=None):
    return A.dot(b, out=c)

并将呼叫更改为

MatMul(A, b, c)