分析结果不会出现在事件/度量标准摘要模式nvprof中

时间:2016-06-23 17:05:13

标签: cuda profiling nvprof

根据nvprof的事件/摘要模式documentation,输出如下:

==6461== Profiling application: matrixMul 
==6461== Profiling result: 
==6461== Event result: 
//The outputs 

==6461== Metric result: 
//The outputs

default应显示Profiling result下API调用和内核的延迟,百分比等。所以有两个问题:

  1. 为什么不在Profiling Result下输出任何内容?
  2. 如何让nvprof同时输出Profiling Result

1 个答案:

答案 0 :(得分:1)

  

为什么在分析结果下没有任何输出?

根据documentation,它声明:

  

nvprof一个下列模式中运行。

这些模式是:

  • 3.1.1摘要模式(默认)
  • 3.1.2 GPU跟踪和/或API跟踪模式
  • 3.1.3事件/指标摘要模式
  • 3.1.4事件/指标跟踪模式

您的摘录信息来自 3.1.3事件/指标摘要模式。当您处于此模式时,您不处于任何其他模式,并且其他模式的数据收集(和输出)描述不适用。

  

如何让nvprof同时输出Profiling Result

如果要基于每个内核捕获度量标准信息,请使用3.1.4事件/度量标准跟踪模式。输出将显示在Profiling Result部分。

对于其他组合,不可能让nvprof在一次运行中显示任意分析数据集合。如果您需要仅在特定模式下可用的输出,则需要在该模式下运行才能获得该输出。您可能需要多次运行nvprof以获取您要收集的所有输出信息或数据。 nvvp(视觉分析器)执行此操作(即将在引擎盖下多次运行nvprof),以便为给定的应用程序视图显示更大范围的数据。