我正在尝试理解nvprof中使用的不同事件域之间的区别。
当我尝试
时nvprof --devices 0 --query-events
它列出了分类到多个域(domain_a,domain_b,domain_c,domain_d等等)的可用事件。
我已经读过,根据域名,它会因所有SM或其中几个SM的事件计数而异。但我无法找出所有人都计算在哪个领域的事件......
如果有人可以解释这些域名,那就太好了。
答案 0 :(得分:1)
在nvprof中,默认情况下会为可以分析的所有实例分析事件,并为所有可用实例推断数据。 如果由于硬件限制而无法分析所有可用实例,则nvprof会发出以下警告:
== 14882 ==警告:以下聚合事件值是从有限的配置文件数据中推断出来的,因此可能是 不准确的。要查看非聚合事件值,请使用 “--aggregate-mode off”。
如果可以对所有可用实例进行分析,那么您将看不到此消息。
您可以在--aggregate-mode off
之前提供--events
选项,以便为所有域实例配置事件。例如:
./ nvprof --aggregate-mode off --events warps_launched ./matrixmul
在将来的版本中,有关域的配置文件实例和可用实例的信息将在--query-events
选项中提供。