Cuda虚拟课

时间:2012-10-03 02:32:04

标签: c++ cuda virtual-functions

我想在cuda内核中执行一些虚方法,但不是在同一个内核中创建对象,而是想在主机上创建它并将其复制到gpu内存。

我在内核中成功创建对象并调用虚方法。复制对象时出现问题。这是有道理的,因为显然虚函数指针是假的。 发生的事情只是“Cuda网格发射失败”,至少这是Nsight所说的。 但是当看到SASS时,它会在虚拟函数指针的解除引用时崩溃,这是有道理的。

我当然使用Cuda 4.2以及在拟合卡上使用“compute_30”进行编译。

那么推荐的方式是什么?或者这个功能根本不受支持?

我有想法先运行一个不同的内核,它创建虚拟对象并在复制之前提取虚拟函数指针以“修补”我的对象。可悲的是,这并没有真正发挥作用(还没有想到它)以及它将是一个丑陋的解决方案。

P.S。这实际上是this问题的重演,遗憾的是,这个问题从未得到完全回答。

编辑:

所以我找到了一种方法来做我想做的事。但要明确一点:这根本不是一个答案或解决方案,答案已经提供,这只是一个黑客,只是为了好玩。

首先让我们看看Cuda在调用虚拟方法时正在做什么,下面是调试SASS

//R0 is the address of our object
LD.CG R0, [R0];  
IADD R0, R0, 0x4;  
NOP;  
MOV R0, R0;  
LD.CG R0, [R0];
...
IADD R0, RZ, R9;  
MOV R0, R0;  
LDC R0, c[0x2][R0];
...
BRX R0 - 0x5478

因此,假设“c [0x2] [INDEX]”对于所有内核都是常量,我们可以通过运行内核并执行此操作来获取类的索引,其中obj是类的新创建的对象:

unsigned int index = *(unsigned int*)(*(unsigned int*)obj + 4);

然后使用这样的东西:

struct entry
{
    unsigned int vfptr;// := &vfref, thats our value to store in an object
    int dummy;// := 1234, great for debugging
    unsigned int vfref;// := &dummy
    unsigned int index;
    char ClassName[256];//use it as a key for a dict
};

将其存储在主机以及设备内存中(内存位置为设备内存),在主机上,您可以使用ClassName作为查找“修补”对象。

但是又一次:我不会在任何严肃的事情中使用它,因为性能明智,虚拟功能根本不是很好。

1 个答案:

答案 0 :(得分:5)

目前,CUDA编译器和运行时(从CUDA 5.0开始)不支持您尝试执行的操作。 CUDA C编程指南v5.0的D.2.6.3节读取:

  

D.2.6.3虚拟功能

     

当派生类中的函数覆盖基类中的虚函数时,重写和重写函数上的执行空间限定符(即__host____device__)必须匹配。

     

不允许将__global__函数作为参数传递给类的对象   虚拟功能。

     

虚函数表由编译器放在全局或常量内存中。

我建议您将类的数据与类的功能分开封装。例如,将数据存储在结构中。如果您计划对这些对象的数组进行操作,请将数据存储在数组结构中(以提高性能 - 超出此问题的范围)。使用cudaMalloc在主机上分配数据结构,然后将数据作为参数传递给内核,而不是使用虚方法传递类。

然后在设备上使用虚拟方法构造对象。使用虚方法的类的构造函数将设备指针内核参数作为参数。然后,虚拟设备方法可以对设备数据进行操作。

同样的方法可以用于在设备上的一个内核中分配数据,并在设备上的另一个内核中访问它(因为具有虚函数的类不能是内核的参数)。