标签: visual-studio-2010 cuda compiler-optimization
在两台不同的机器上编译的同一个CUDA内核的计算时间差异大约是3-4倍。两个版本都在同一台机器和GPU设备上运行。解释差异的直接结论是不同的编译器设置。虽然没有单一的完美设置,并且应根据内核自定义调整,但我想知道是否有任何明确的指导方针可帮助您选择正确的设置。我使用Visual Studio 2010.谢谢。
答案 0 :(得分:3)
-G