了解nvprof事件域

时间:2014-01-10 19:08:19

标签: cuda nvidia profiler

我正在尝试理解nvprof中使用的不同事件域之间的区别。

当我尝试

nvprof --devices 0 --query-events

它列出了分类到多个域(domain_a,domain_b,domain_c,domain_d等等)的可用事件。

我已经读过,根据域名,它会因所有SM或其中几个SM的事件计数而异。但我无法找出所有人都计算在哪个领域的事件......

如果有人可以解释这些域名,那就太好了。

1 个答案:

答案 0 :(得分:1)

在nvprof中,默认情况下会为可以分析的所有实例分析事件,并为所有可用实例推断数据。 如果由于硬件限制而无法分析所有可用实例,则nvprof会发出以下警告:

  

== 14882 ==警告:以下聚合事件值是从有限的配置文件数据中推断出来的,因此可能是   不准确的。要查看非聚合事件值,请使用   “--aggregate-mode off”。

如果可以对所有可用实例进行分析,那么您将看不到此消息。

您可以在--aggregate-mode off之前提供--events选项,以便为所有域实例配置事件。例如:

  

./ nvprof --aggregate-mode off --events warps_launched ./matrixmul

在将来的版本中,有关域的配置文件实例和可用实例的信息将在--query-events选项中提供。