标签: cuda
我是CUDA的新手,我想请求您的帮助,知道是否可以更改内核数量来计算程序的效率和可扩展性,除了使用每个块的线程数和执行的线程块。也就是说,如果它假设效率和可扩展性基于处理器的数量,并且我从我的FERMI GPU中的512个内核开始,我怎么能从512更改为256,128等内核才能获得对于给定的数据负载,不同加速? 在此先感谢!!
答案 0 :(得分:3)
CUDA不支持这种类型的硬件粒度,并且无法以您询问的方式控制核心。