应用错误收集

如何在TCM上堆叠会降低处理器性能

时间：2015-07-29 07:22:41

标签： performance arm benchmarking tcm

我通过使用不同场景运行coremark基准来测量ARM cortex R5f处理器性能。一种情况是在ATCM内存上设置STACK。

在没有inline标志的情况下进行编译时，TCM上的STACK会得到更好的结果。当使用inline标志进行编译时，RAM上的STACK会得到更好的结果。

如果TCM更快更接近处理器，怎么解释呢？

在TCM上设置堆栈时，我的程序中没有堆栈溢出。

1 个答案:

答案 0 :(得分：1)

如果TCM更快更接近处理器，怎么解释呢。

您的TCM是否比L1数据缓存更快？并非总是如此（许多设计具有单周期L1 D高速缓存，但对TCM进行两次循环访问）。

TCM的通常目的不是性能（虽然它很好），但可预测性 - 您无法在TCM中获得缓存缺失，因此实时系统将其用于计时关键代码和数据部分。