确定变量访问的次数

时间:2013-10-26 23:53:36

标签: c cuda gdb memory-profiling

我正在优化CUDA内核中的共享内存,因此我需要确定哪些变量是存储在共享内存中的最佳候选(即,最常访问的)。我知道我可以浏览代码并计算每个变量被访问的次数,但内核相当复杂,所以我希望有一种方法可以实现自动化。我可以让GDB计算在一般CPU代码中或特别是在cuda-gdb中访问每个变量的次数吗?或者是否有其他有用的分析/调试工具?

感谢。

1 个答案:

答案 0 :(得分:1)

我不知道任何能够计算所涉及线程访问特定变量的次数的性能指标。也许您应该查看反汇编的微码(cuobjdump--dump-sass选项)以确定发生了多少次。

但是,请注意,在现代架构(例如,Fermi和Kepler)中,共享内存可以被视为“受控L1缓存”,因此如果不从L1中驱逐变量,则可能不需要使用它。要了解全局内存变量从L1缓存中逐出的频率,如果您不想手动计算访问号,可以查看nvprof的某些性能指标。例如,您可以考虑global_cache_replay_overheadgld_efficiencygst_efficiency等。您可以在Metrics Reference找到完整的效果指标列表。

最后,正如@talonmies所建议的那样,您可能希望考虑使用寄存器代替共享内存来处理一些常用变量,以便更快地访问。