将具有不同偏移的相同图像添加到GPU上的累积图像

时间:2015-03-07 18:57:49

标签: image-processing gpu gpgpu

正如标题所述,我正在尝试将存储在列表中的具有不同偏移的相同图像添加到累积图像。

enter image description here 当前的实现在CPU上执行此操作,并且对于某些内在函数,它可以非常快。

然而,对于较大的图像(2048x2048)和列表中的许多偏移(~10000),性能并不令人满意。

我的问题是,可以在GPU上有效地实现具有不同偏移的图像的累积吗?

1 个答案:

答案 0 :(得分:1)

是的,你可以。结果可能很多比在CPU上快。诀窍是不为每次添加发送数据,甚至不为每次添加都启动新内核:你拥有的内核应该同时做一些相当数量的偏移量添加,至少16次但可能是几百次,具体取决于您的典型列表大小(当然,您可以拥有多个内核)。