instrA比CPU上的instrB要快,但GPU上反之亦然?

时间:2015-05-18 19:55:55

标签: c parallel-processing opencl gpu gpgpu

有一个例子:

on CPU, Instruction A is faster than Instruction B
However, 
on GPU, Instruction B is faster than Instruction A
(Instructions are assumed to be math operations)

这可能是由于GPU的某些因素造成的:

  • GPU并行执行数据相关指令,这可能比顺序执行更糟糕
  • 高缓存未命中率,银行冲突

1 个答案:

答案 0 :(得分:2)

当然,很长一段时间GPU对于32b整数运算(特别是乘法)没有本机支持是很常见的。有许多CPU / GPU组合,其中32b整数乘法比CPU上的32b浮点乘法快,反之亦然。