CUDA内核作为类的成员函数

时间:2012-12-06 16:36:26

标签: c++ windows cuda

我使用的是CUDA 5.0和Compute Capability 2.1卡。

问题非常简单:内核可以成为类的一部分吗? 例如:

class Foo
{
private:
 //...
public:
 __global__ void kernel();
};

__global__ void Foo::kernel()
{
 //implementation here
}

如果没有,那么解决方案是创建一个包装类函数,并在内部调用内核?

如果是,那么它是否可以作为普通私有函数访问私有属性?

(我不只是尝试它,看看会发生什么,因为我的项目现在有其他几个错误,而且我认为这是一个很好的参考问题。我很难找到使用CUDA和C ++的参考。基本功能可以找到示例,但不能找到结构化代码的策略。)

1 个答案:

答案 0 :(得分:4)

让我暂时不讨论cuda动态并行性(即假设计算能力3.0或之前)。

记住__ global__用于cuda函数,这些函数将(仅)从主机调用(但在设备上执行)。如果在设备上实例化此对象,则无法使用。此外,要使成员函数可以访问设备可访问的私有数据,必须在设备上实例化该对象。

所以你可以在主机对象成员函数中嵌入一个内核调用(即。mykernel<<<blocks,threads>>>(...);,但内核定义(即带有__ global__装饰器的函数定义)通常会在源代码中的对象定义之前。如前所述,这种方法不能用于在设备上实例化的对象。它也不能访问在对象中其他地方定义的普通私有数据。(有可能想出一个主机对象的方案,它使用全局内存中的指针创建设备数据,然后可以在设备上访问,但这样的方案对我来说似乎很尴尬)。

通常,设备可用的成员函数前面会有__ device__装饰器。在这种情况下,设备成员函数中的所有代码都在调用它的线程中执行。

This question给出了一个C ++对象的示例(在我的编辑答案中),该对象具有可从主机和设备调用的成员函数,并在主机和设备对象之间进行适当的数据复制。