我刚刚从CUDA 4迁移到5并在Ubuntu 12.04上安装了刚刚发布的CUDA 5.0,但性能却大幅下降。过去需要1秒钟的特定CUDA内核需要6秒钟。似乎新的驱动程序是罪魁祸首,因为当我重新安装旧的4驱动程序性能重新获得,但我不知道为什么。有没有人遇到类似的问题?
答案 0 :(得分:2)
抱怨这么久才能回来......
我发现主要罪魁祸首是__threadfence()。不太了解它的使用我写的是像
__threadfence()
__syncthreads()
在新的驱动程序上,这需要花费很多额外的时间
我正在研究GTX680
非常感谢 丹尼尔