用编译器优化计算加速

时间:2013-07-20 13:06:33

标签: gcc cuda gpu compiler-optimization nvcc

当我们在GPU上讨论Cuda中的并行程序时,CPU的速度超过了类似的顺序程序,顺序编程是否应该由编译器优化器(gcc -O2)编译?

我在GPU上并行了一个程序。与没有编译器优化器的CPU实现相比,它的速度提高了18。但是当我将选项-O2添加到nvcc编译器时,加速率降低到8.

1 个答案:

答案 0 :(得分:1)

当然,在比较性能时,优化器应该用于GPU和CPU程序。

如果您专注于GPU v.s. CPU,比较不应受软件代码质量的影响。我们经常假设代码应该在其硬件上具有最佳性能。

相关问题