我想计算最佳的gridsize和blocksize,以便在内核启动时拥有较高的占用率。我已经看到CUDA中有一个函数可以这样做,就是这个:
cudaOccupancyMaxPotentialBlockSize()
我正在使用PyCUDA,我想知道PyCUDA中是否存在等效函数。
答案 0 :(得分:1)
据我所知,驱动程序API占用函数(包括cuOccupancyMaxPotentialBlockSize
)尚未在PyCUDA中实现,自版本2015.1.3起,based on a search of the Github mirror。