在具有CUDA功能的示例设备中,内存层次结构的测量延迟值是多少?

时间:2011-12-09 19:43:31

标签: cuda benchmarking latency

即使this问题类似于我的问题,但仍然没有针对不同类型的已发布延迟值。我很欣赏实际测量以及他们的方法的方法和推理的解释。任何支持CUDA的离散NVidia卡都是理想的。

需要衡量的事项:

  1. 注册

  2. 共享内存

  3. 常量缓存命中

  4. 设备内存

  5. 全球记忆

1 个答案:

答案 0 :(得分:3)

This paper几乎是CUDA GPU的黄金标准基准测试示例。它使用Tesla C1060 / GTX 285“GT200”级GPU,通过非常彻底的微基准测试,显示您感兴趣的大部分信息。