我参与了一个在主内存中分配大约1TByte数据的计算。 我需要了解内存访问模式可以影响处理器的带宽。
例如,我读到英特尔至强处理器可以支持65GBytes /秒的内存带宽。这是否意味着在所有内存访问模式下或仅在最佳访问模式下实现此带宽?
我知道每次向主内存发送数据的请求都会被拉入整个缓存行(64字节)。我认为内存访问模式是最佳的,如果在每次请求时都在下一个请求发出之前使用整个缓存行。最糟糕的情况是,如果在每个请求中,在下一个请求发出之前仅使用一个双精度(8字节)。
假设我知道在每个请求中平均来自8个双打,我将在下一个请求发出之前仅使用f = 1,2,...,8。有没有一种简单的方法来计算我将得到的实际带宽作为f?'
的函数提前致谢所有回复