我正在尝试使用clGetEventProfilingInfo()
在多GPU环境中分析代码,但我认为我无法关联来自不同GPU的时间戳。一个简单的code sample使用两个GPU比使用一个GPU快两倍,但时间戳表明一个GPU在另一个GPU开始之前执行了大部分工作。
[spec] http://www.khronos.org/registry/cl/sdk/1.1/docs/man/xhtml/clGetEventProfilingInfo.html)只是说,这样的时间戳是“64位值,用于描述当前设备时间计数器,单位为纳秒[...]” 。
我是否必须假设这些不必同步?
供参考:
答案 0 :(得分:0)
规范还说“OpenCL设备需要正确跟踪设备频率和电源状态变化的时间。”这意味着返回的时间仅相差两个设备之间的常数,并且每个设备之间的“实际”挂钟时间。