应用错误收集

GPU上的矢量化代码

时间：2015-05-11 18:03:55

标签： opencl

我正在使用OpenCL在不同的GPU和CPU上同时执行一个过程，以获得高性能的结果。英特尔OpenCL始终显示内核未向量化的消息，因此它只能在不同的内核上运行，但不会使用SIMD指令运行。我的问题是，如果我重写代码以便可以利用OpenCL代码利用SIMD指令，它是否也会提高GPU性能？

1 个答案:

答案 0 :(得分：2)

是的 - 但请注意，基于AMD GCN的APU / GPU或Nvidia Fermi或更高GPU硬件不需要这样做以获得良好的性能 - 它们可以很好地利用标量操作。然而，CPU和Intels GPU可以通过SIMD指令大大受益，这就是矢量操作归结为的。