应如何将定义的函数应用于cupy.array而不是np.vectorize? 在cupy中是否实现了类似的功能?
我正在用Python 3.6.9编写仿真程序。
我想在带有CuPy(CUDA10.1为6.0.0)的GPU(GTX1060,NVIDIA)中进行仿真。
在原始代码中,函数numpy.vectorize已用于将定义的函数应用于np.array。但是,CuPy中尚未实现相同的功能。
原始代码(使用numpy)如下:
#For define function
def rate(tmean,x,y,z):
rate = 1/z/(1 + math.exp(-x*(tmean-y)))
#DVR<0
if rate < 0:
rate = 0
return rate
#tmean is temperature data(365,100,100) and loaded as np.array
#paras is parameter(3,100,100)
#vectorized
f = np.vectorize(rate)
#roop
for i in range(365):
#calc developing rate(by function "rate") and accumulate
dvi[i,:,:] = dvi[i-1,:,:] + f(tmean[i,:,:],paras[0],paras[1],paras[2])
我知道numpy的功能几乎已在CuPy中实现。 所以我改变了
f = np.vectorized(rate)
到
f= cp.vectorized(rate)
但是发生AttributeError。
答案 0 :(得分:1)
GPU无法并行化任意Python代码。用NumPy兼容的操作(如
)编写所有内容def rate_(xp, tmean,x,y,z):
rate = 1/z/(1 + xp.exp(-x*(tmean-y)))
rate[rate < 0] = 0
return rate
f = functools.partial(rate_, xp=cupy)
为加快速度,可以使用cupy.ElementwiseKernel
(https://docs-cupy.chainer.org/en/stable/tutorial/kernel.html),它为向量化操作创建单个内核。
f = cupy.ElementwiseKernel(
'T tmean, T x, T y, T z',
'T rate',
'''
rate = 1/z/(1 + exp(-x*(tmean-y)));
// DVR<0
if (rate < 0) {
rate = 0;
}
'''
)
要通过Python代码创建内核,请尝试cupy.fuse
。
@cupy.fuse()
def f(tmean,x,y,z):
rate = 1/z/(1 + cupy.exp(-x*(tmean-y)))
return cupy.where(rate < 0, 0, rate) # __setitem__ is not fully supported