我看到一些CUDA指标完全令人困惑。根据定义
sm_efficiency 在GPU上所有多处理器上平均在多处理器上至少一次扭曲发生的时间百分比
warp_execution_efficiency 表示的每线程平均活动线程数与多处理器支持的每线程最大线程数之比
achieved_occupancy 每个活动周期的平均活动经纱与多处理器上支持的最大经纱数量的比率
我想知道这些指标之间是否存在一般关系。例如,高占用率总是意味着高变形执行效率,等等?否则,它们是正交的,并且这些情况可能会导致高SM效率和低占用率。
第一个度量标准是关于时间,而其他度量标准是关于线程和扭曲的数量。 有人可以澄清吗?
答案 0 :(得分:1)
第一个和第三个指标密切相关且正相关。它们都是关于时间的翘曲,两者都不同,只是第一个度量对翘曲数应用了“> 0”运算符。除此之外,它们是相同的-但是该运算符删除了经纱数量的“维度”,只为您提供了1 / Time指标,而不是Warps / Time指标。
对于第二个度量,这与经纱内的线程发散有关。尽管它可能与第三个指标相关,但事实并非如此。经纱中线程之间发生的情况几乎与不同经纱中发生的情况正交。