在altera设计实例中,我尝试了vector vector,但是我无法从编译结果中获得内核的吞吐量和延迟。
我阅读了Altera的编程指南。它提到使用profile.mon
。
是否可以使用-march=emulator --profile
来运行aocl报告?
另外请告诉我是否有其他方法可以获得内核的吞吐量和延迟。
答案 0 :(得分:2)
您可以在 Altera SDK for OpenCL最佳实践指南中查看可从Profiler获取的信息。有示例屏幕截图和详细信息。 这是link,它会直接将您带到该部分。
我可能错了,但我认为无法从模拟器获取分析信息。我总是构建完整的内核来实现它。
答案 1 :(得分:1)
西蒙,如果你不介意一个历史悠久的“冒险”,你可以尝试下载并安装13.1版本的Altera(现在的英特尔)OpenCL SDK。这些旧工具可以选择默认打印输出或通过--estimate-throughput开关打印输出。这些估计仅适用于Stratix V卡(例如PCIe385n_d5)。 Arria 10当时不存在。但是要知道架构设备有点类似,这应该给你一些指导。之后不要忘记向英特尔提交服务请求,将这些估算值反馈到OpenCL SDK编译器中。
如果你更冒险的类型,即使没有DDRx和PCIe模型,你也可以在Modelsim Intel Starter Edition(免费)中模拟你的内核,这将为你提供周期准确的吞吐量和延迟问题答案。您可以使用QSYS自动生成整个测试台。