如何在Intel Xeon E5-2690的GFlop / s中获得峰值性能?

时间:2013-10-02 09:59:18

标签: performance cpu cpu-speed

我能够在此Processor Comparison中找到Xeon E5-2690的理论DP峰值性能371 GFlop / s(有趣的是,在英特尔的竞争对手中比在英特尔支持页面本身更容易找到此信息)。但是,当我尝试推导出峰值性能时,我的推导不匹配:

  1. Xeon E5-2690的每个核心的频率(在Turbo模式下)= 3.8Ghz
  2. 处理器可以在每个周期执行addmul操作,因此我们得到:3.8 x 2 = 7.6
  3. 鉴于它具有AVX支持,它可以在每个周期执行4次双重操作:7.6 x 4 = 30.4
  4. 最后,它有8个核心,因此得到:8 x 30.4 = 243.2
  5. 因此,Gflop / s的峰值性能为243.2 GFlop / s而不是371 GFlop / s?

1 个答案:

答案 0 :(得分:6)

Turbo Mode不用于计算Theoretical Peak Performance,您必须考虑以下内容:

CPU速度= 2.9 GHz

CPU内核= 8

每个周期的CPU指令= 8(考虑到AVX-256 - > 256位单位,可以容纳8个单精度值)x 2(像你说的那样添加和运算)= 16

全部放在一起:

2.9x8x16 = 371 GFlops / s