如何在设备/ nvidia显卡上以编程方式查找并发cuda线程或流式多处理器的最大数量?我知道warpSize
,但没有warpCount
。
most answers on the internet关注从pdfs中查找内容。
答案 0 :(得分:2)
您是否尝试过检查他们的SDK示例,我认为此示例是您想要的样本 Device Query
答案 1 :(得分:1)
这不仅取决于设备,还取决于您的代码 - 例如比如每个线程使用的寄存器数量或块所需的共享内存量。我建议读一下入住率。
我要注意的另一件事是,如果你的代码依赖于在设备上驻留一定数量的线程(例如,如果你等待多个线程到达某个执行点),你将面临一些竞争条件并且看到你的代码挂起。