如何在Linux上使用cuda 4.2 profiler在GTX480上分析L1和L2缓存命中率?

时间:2013-03-18 19:34:37

标签: performance cuda gpu gpgpu

我使用了之前版本的Nvidia探测器来分析l1和l2缓存命中率,但我不确定我使用的是哪个版本。似乎cuda 4.2 visual profiler没有L1和L2分析信息(全局缓存重放开销除外)。如何使用cuda 4.2(或特定的先前版本)可视/命令行分析器来分析L1或L2缓存命中率?

1 个答案:

答案 0 :(得分:1)

不确定您是使用Windows还是Linux,但是使用Windows,您可以使用适用于MS Visual Studio的Parallel Nsight(还有一个用于eclipse的版本)。 Nsight允许您定义许多不同的“实验”。即使你可以使用“自定义”实验。如果选择“内存”实验,它将包括所需的L1和L2缓存命中率。我附上了显示Parallel Nsight Performance screenshot

的屏幕截图

这取自NSight paralell 3.0,但也可以在以前的版本中使用。

<强>编辑:

使用visual profiler(至少5.0版但我猜之前的版本会类似)你可以设置你感兴趣的事件和指标,在Visual Profiler 5.0中你可以点击Run - &gt;配置度量标准和事件。在附加的窗口中,您可以设置要监视的任何计数器。可用的指标和事件将取决于底层硬件(即GPU具有的可访问计数器)。为我的GTX 480中的某些内存计数器附加图片 Cache Events GTX 480 visual profiler 5.0

编辑2: 好的只是注意到你在编辑原始问题后要求Linux ...所以对于linux我不知道NVidia是否提供了这样的Visual Profiler(我猜他们这样做)。如果没有,您可能对Eclipse NSight版本感兴趣...