标签: c performance optimization x86 avx
可能重复: Prefetching Examples?
在许多情况下,预取指令似乎会降低现代机器的性能,因为通常会有一些不同的硬件预取单元。
是否有任何特殊情况总是有助于使用预取指令?