我应该怎么做,而不是在CuPy中使用numpy.vectorize?

时间:2019-11-04 15:23:37

标签: python cupy

应如何将定义的函数应用于cupy.array而不是np.vectorize? 在cupy中是否实现了类似的功能?

我正在用Python 3.6.9编写仿真程序。

我想在带有CuPy(CUDA10.1为6.0.0)的GPU(GTX1060,NVIDIA)中进行仿真。

在原始代码中,函数numpy.vectorize已用于将定义的函数应用于np.array。但是,CuPy中尚未实现相同的功能。

原始代码(使用numpy)如下:

#For define function
def rate(tmean,x,y,z):
    rate = 1/z/(1 + math.exp(-x*(tmean-y)))
    #DVR<0
    if rate < 0:
        rate = 0
    return rate

#tmean is temperature data(365,100,100) and loaded as np.array
#paras is parameter(3,100,100)
#vectorized
f = np.vectorize(rate)
#roop
for i in range(365):
    #calc developing rate(by function "rate") and accumulate
    dvi[i,:,:] = dvi[i-1,:,:] + f(tmean[i,:,:],paras[0],paras[1],paras[2])

我知道numpy的功能几乎已在CuPy中实现。 所以我改变了

f = np.vectorized(rate) 

f= cp.vectorized(rate)

但是发生AttributeError。

1 个答案:

答案 0 :(得分:1)

GPU无法并行化任意Python代码。用NumPy兼容的操作(如

)编写所有内容
def rate_(xp, tmean,x,y,z):
    rate = 1/z/(1 + xp.exp(-x*(tmean-y)))
    rate[rate < 0] = 0
    return rate

f = functools.partial(rate_, xp=cupy)

为加快速度,可以使用cupy.ElementwiseKernelhttps://docs-cupy.chainer.org/en/stable/tutorial/kernel.html),它为向量化操作创建单个内核。

f = cupy.ElementwiseKernel(
    'T tmean, T x, T y, T z',
    'T rate',
    '''
    rate = 1/z/(1 + exp(-x*(tmean-y)));
    // DVR<0
    if (rate < 0) {
        rate = 0;
    }
    '''
)

要通过Python代码创建内核,请尝试cupy.fuse

@cupy.fuse()
def f(tmean,x,y,z):
    rate = 1/z/(1 + cupy.exp(-x*(tmean-y)))
    return cupy.where(rate < 0, 0, rate)  # __setitem__ is not fully supported