标签: performance caching memory intel latency
This thread有一个很好的列表,可以在单处理器环境中访问计算机体系结构的各个部分。在双处理器环境中,通过英特尔的QPI总线怎么样?
假设在第一个CPU上分配了一个64字节的数据包内存。第二个CPU必须通过8.0 GT / s QPI总线访问它,所以我知道单独的序列化延迟是4~ns。我应该在QPI总线上有什么额外的延迟?