标签: c++ performance caching optimization cpu
我理解时间/空间局部性在编码时如何影响设计决策,我也理解对齐何时影响缓存性能。但是,有人可以演示一些C ++的示例,其中考虑缓存关联性以使代码片段更快吗?
让我们说x86,Intel CPU,其中L1缓存是8路组关联,L2是8路组关联,L3是16路组关联。
(我的这个问题的总体目标是了解集合关联性在编写代码和编程硬件时如何影响性能,以便在了解目标架构时获得性能)