我有一台带有13个SMX的开普勒K20c,我正在做一些生物信息学研究。为了更好地理解Hyper-Q,我从Nvidia下载了这个样本:simpleHyperQ但是我得到了不同的结果。
示例只是在每个流中启动两个不同的内核,以便在Fermi和Kepler中显示不同的内容。但我的结果看起来像开普勒和费米之间的东西! 看起来很奇怪!谁能告诉我为什么会这样呢?
答案 0 :(得分:0)
感谢迈克尔。问题是由CUDA_DEVICE_MAX_CONNECTIONS引起的,只需使用以下命令将此变量设置为32:
export CUDA_DEVICE_MAX_CONNECTIONS=32
这将解决这个问题