标签: cuda nvvp
根据CUDA streams not overlapping,“探查器将序列化流以获得准确的时序数据”。 现在的问题是,无论如何要避免cuda性能分析中的这种序列化行为(例如nvvp)? 我正在使用Fermin M2090和cuda-4.0。
答案 0 :(得分:3)
Visual Profiler 5.0(包括nvprof和CUPTI)和Nsight Visual Studio Edition 2.0及更高版本(> 2岁)支持Fermi和Kepler设备的并发内核跟踪。