我正在使用OpenCL在不同的GPU和CPU上同时执行一个过程,以获得高性能的结果。英特尔OpenCL始终显示内核未向量化的消息,因此它只能在不同的内核上运行,但不会使用SIMD指令运行。我的问题是,如果我重写代码以便可以利用OpenCL代码利用SIMD指令,它是否也会提高GPU性能?
答案 0 :(得分:2)
是的 - 但请注意,基于AMD GCN的APU / GPU或Nvidia Fermi或更高GPU硬件不需要这样做以获得良好的性能 - 它们可以很好地利用标量操作。然而,CPU和Intels GPU可以通过SIMD指令大大受益,这就是矢量操作归结为的。