应用错误收集

时间：2013-11-13 13:03:20

标签： c++ c optimization prefetch cpu-cache

据我所知，硬件预取器至少会检测并通过内存获取持续的步幅。此外，无论真正意味着什么，它都可以monitor data access patterns。这让我想知道，硬件预取程序是否会根据存储在内存中的实际数据做出决定，或者纯粹基于程序展示的行为？

我问的原因是因为我偶尔会使用“非本地”指针作为指针。一个简单的例子就是预分配的东西数组，以及索引这个数组而不是指针的小整数。如果我需要存储大量这样的“指针”，内存的节省可以快速增加，从而通过使用更少的内存间接提高缓存性能。

但据我所知，这可能会干扰硬件预取器的工作方式。或不！

我当然可以想象，现实与否，预取单元检查进入L1缓存的缓存行以获取本机指针地址并开始将它们提取到L2或某些此类事物中。在那种情况下，我拯救记忆的聪明伎俩突然变得不那么聪明了。

那么，现代硬件预取器的作用是什么呢？他们可以被“非本地”指针绊倒吗？

答案 0 :(得分：21)

硬件预取器没有看到指针，它看到内存地址。它不关心地址来自何处，或者它在您编写的C ++程序中的类型。它只是查看CPU被告知读取或写入的地址。

所以不，索引到数组不会是CPU以前从未遇到过的可怕新事物。

答案 1 :(得分：10)

链接数据结构（LDS）预取仍然是计算机体系结构中的已知问题。我不熟悉任何真正做到这一点的现代CPU，但理论上它是可能的。多年来，有几篇学术论文提出了一些变化：

这两种方法都可能受到您的技术的影响（第一种方法会变得无用，如果编译器足够聪明，第二种方法可能会起作用）。

当然你必须真正在这样的机器上运行所以它只是理论上的，你不应该改变你的练习，如果它适合你，但它表明每个微观特征应该是特定的 - 架构和系统，以及在一种情况下对你有帮助的东西，对另一种情况可能效率较低一般来说 - 不要只信任CPU做或不进行一些优化（除非记录在案），总是检查你是否得到了预期的行为。

顺便说一下，请注意，即使硬件看到内存的内容，它仍然在虚拟地址空间中 - 硬件无论如何都要对物理地址进行某种转换才能使用它，所以从某种意义上说没有任何额外的开销。

一些参考书目：