标签: gcc cuda gpu compiler-optimization nvcc
当我们在GPU上讨论Cuda中的并行程序时,CPU的速度超过了类似的顺序程序,顺序编程是否应该由编译器优化器(gcc -O2)编译?
我在GPU上并行了一个程序。与没有编译器优化器的CPU实现相比,它的速度提高了18。但是当我将选项-O2添加到nvcc编译器时,加速率降低到8.
答案 0 :(得分:1)
当然,在比较性能时,优化器应该用于GPU和CPU程序。
如果您专注于GPU v.s. CPU,比较不应受软件代码质量的影响。我们经常假设代码应该在其硬件上具有最佳性能。