我编写了一个程序来创建一个颜色查找表。我在CUDA和OpenCL中做过,从我的观点来看,两个程序几乎相同,即使用相同数量的常量内存,全局内存,相同的循环和分支代码等。
我衡量的是运行时间,而CUDA的表现略好于OpenCL。我的问题是,如果使用CUDA + NvidiaGPU比OpenCL + NvidiaGPU更快,因为CUDA是编程这种GPU的本地方式吗?
您能否分享一些与此主题相关的信息的链接?
答案 0 :(得分:2)
如果针对目标架构正确调整OpenCL和CUDA,它们同样快。但是,调整可能会对可移植性产生负面影响。
链接: