如何告诉PyCUDA重用早期内核的内存?

时间:2012-02-03 10:27:42

标签: pycuda

我的程序有两个内核,第二个内核应该使用已经上传的输入数据和第一个内核的结果,所以我可以保存内存传输。我该如何存档?

这就是我启动内核的方式:

result = gpuarray.zeros(points, dtype=np.float32)  

kernel(
    driver.In(dataT),result,np.int32(points),
    grid = (blocks,1),
    block = (block_size, 1, 1),
)

1 个答案:

答案 0 :(得分:1)

在pycuda中,除非您明确要求,否则不会向设备传输数据或从设备传输数据。 例如,如果您使用以下命令分配内存并将一些数据传输到GPU:

result = float64(zeros( (height,width) )
result_device = gpuarray.to_gpu(result)

变量result_device是对GPU中数据的引用。您可以将result_device传递给任何其他内核,而不会将内存传输回CPU。 在这种情况下,当您致电时会再次发生内存传输:

result = result_device.get()