理解并行中的通信延迟

时间:2013-11-18 03:16:11

标签: caching parallel-processing computer-science computer-architecture parallelism-amdahl

我正在阅读“计算机体系结构:定量方法,第5版”,我正在查看第350页第5章的示例。附件是对相关示例的扫描。在这个例子中,我并不完全遵循他们如何做事的逻辑。

enter image description here

我的问题如下:

  1. 0.3ns循环时间从何而来?
  2. 200 / 0.3大约是666个循环,我遵循这个。然而,当插回CPI方程时,没有意义:0.2%(0.002)x 666等于1.332而不是1.2。这是怎么回事?
  3. 当他们说“具有所有本地引用的多处理器是1.7 / 0.5 =快3.4倍”时,他们从哪里得到它?含义:我在给定的信息中看不到地方通信的速度是原来的两倍......
  4. 任何帮助都将不胜感激。

1 个答案:

答案 0 :(得分:3)

  

0.3ns的循环时间来自何处?

来自3.3 GHz的时钟频率。 1 / 3.3 GHz = 0.3ns。

  

200 / 0.3大约是666个循环,我遵循这个。然而,当插回CPI方程时,没有意义:0.2%(0.002)x 666等于1.332而不是1.2。这是怎么回事?

我认为你是对的。这看起来像是一个印刷错误。那应该是

CPI = 0.5 + 1.33 = 1.83

  

当他们说“具有所有本地引用的多处理器是1.7 / 0.5 =快3.4倍”时,他们从哪里得到它?含义:我在给定的信息中看不到地方通信的速度是原来的两倍......

他们没有说任何地方的本地通信速度是其两倍。他们将他们为多处理器计算的有效CPI除以0.2%的远程参考值,基准CPI为0.5。这告诉您具有所有本地引用的多处理器的速度是多少倍。 (当然它应该是大约1.83 / 0.5 = 3.66倍。)