如何检查Altera OpenCL中的吞吐量和延迟

时间:2016-06-01 05:15:56

标签: opencl intel-fpga

在altera设计实例中,我尝试了vector vector,但是我无法从编译结果中获得内核的吞吐量和延迟。

我阅读了Altera的编程指南。它提到使用profile.mon

是否可以使用-march=emulator --profile来运行aocl报告?

另外请告诉我是否有其他方法可以获得内核的吞吐量和延迟。

2 个答案:

答案 0 :(得分:2)

您可以在 Altera SDK for OpenCL最佳实践指南中查看可从Profiler获取的信息。有示例屏幕截图和详细信息。 这是link,它会直接将您带到该部分。

我可能错了,但我认为无法从模拟器获取分析信息。我总是构建完整的内核来实现它。

答案 1 :(得分:1)

西蒙,如果你不介意一个历史悠久的“冒险”,你可以尝试下载并安装13.1版本的Altera(现在的英特尔)OpenCL SDK。这些旧工具可以选择默认打印输出或通过--estimate-throughput开关打印输出。这些估计仅适用于Stratix V卡(例如PCIe385n_d5)。 Arria 10当时不存在。但是要知道架构设备有点类似,这应该给你一些指导。之后不要忘记向英特尔提交服务请求,将这些估算值反馈到OpenCL SDK编译器中。

如果你更冒险的类型,即使没有DDRx和PCIe模型,你也可以在Modelsim Intel Starter Edition(免费)中模拟你的内核,这将为你提供周期准确的吞吐量和延迟问题答案。您可以使用QSYS自动生成整个测试台。