我正在尝试实现简单的动态并行编程示例,如..
__global__ ChildKernel(void* data){
//Operate on data
}
__global__ ParentKernel(void *data){
ChildKernel<<<16, 1>>>(data);
}
// In Host Code
ParentKernel<<<256, 64>>(data);
他们表示在CUDA 5.0及更高版本中支持它。我安装了CUDA 5.0并在我的系统上运行但是GTX 550 Ti的设备是否支持动态并行?谢谢。