我的gpu是Adreno420。
Nvidia的GPU,-cl-nv-verbose
和-cl-nv-maxrregcount=<N>
都有扩展注册用量检查。
我试图为Adreno系列或其他公司的gpu产品找到类似的关键字。我发现了一个用于减少寄存器使用的内核构建选项。
我阅读了Adreno探查器和调试器的相关文档,但它们看起来没有选项进行寄存器使用检查。
在本文中,寄存器使用情况由JIT编译器而不是程序员确定。
A Case Study of OpenCL on an Android Mobile GPU
DarkZeros在stackoverflow中写的另一个答案描述了同样的事情。
除了构建选项之外,是否无法配置寄存器使用情况或估算它?
答案 0 :(得分:1)
您可以使用Adreno Profiler获取注册用法信息。尝试并使用CL Scrubber,然后您应该能够找到所需的信息。实际上你会发现更多,包括内存命中/未命中率,纹理命中/未命中,ALU利用率等等。