标签: x86 intel amd cpu-architecture
最近的x86架构上的存储到转发失败转发的成本是多少?
特别是,由于加载部分与早期商店重叠,或者因为较早的加载或存储跨越导致转发失败的某些对齐边界而失败的存储到加载转发。
当然有延迟成本:它有多大?是否还存在吞吐量成本,例如,存储到转载失败的转发是否会使用其他负载和存储无法使用的额外资源,甚至是其他非内存操作?
当商店的所有部分都来自商店缓冲区时,与存储缓冲区和L1混合的情况有区别吗?