这是我的NVIDIA图形处理器:Quadro K5200。 CUDA核心总数为2304.块的最佳数量是多少?我机器的线程? 这适用于某些功能内核<<>> (),什么是最佳的x&年。我是CUDA代码的新手。请帮帮我。
答案 0 :(得分:0)
为了找出可用的最大块和线程,我使用这段代码。
cudaDeviceProp prop;
cudaGetDeviceProperties(&prop, 0);
printf("Max Thread Dimensions: %i x %i x %i\n", prop.maxThreadsDim[0], prop.maxThreadsDim[1], prop.maxThreadsDim[2]);
printf("Max Block Dimensions: %i x %i x %i\n", prop.maxGridSize[0], prop.maxGridSize[1], prop.maxGridSize[2]);