我用cudaSDK“simpleStreams”测试了我的GTX590和GTX680。时间线结果显示为图片。有人在GTX 590 memC中解释原因!pyDtoH不能与以前在GTX 680中发生的内核计算重叠吗?
答案 0 :(得分:0)
我的GTX 480也有类似的行为。我怀疑费米有什么问题? 也许与wddm有关? (在这里使用Windows 7 x64)
我尝试过很多不同的驱动程序,所有这些驱动程序都表现出相同的错误行为。你知道GK104经过测试证明是正确的,我已经在旧的8800 GTS上测试了它确实有效。似乎费米卡不起作用:/
修改强>
也看到这一点 How can I overlap memory transfers and kernel execution in a CUDA application?