我能够在此Processor Comparison中找到Xeon E5-2690的理论DP峰值性能371 GFlop / s(有趣的是,在英特尔的竞争对手中比在英特尔支持页面本身更容易找到此信息)。但是,当我尝试推导出峰值性能时,我的推导不匹配:
add
和mul
操作,因此我们得到:3.8 x 2 = 7.6 因此,Gflop / s的峰值性能为243.2 GFlop / s而不是371 GFlop / s?
答案 0 :(得分:6)
Turbo Mode
不用于计算Theoretical Peak Performance
,您必须考虑以下内容:
CPU速度= 2.9 GHz
CPU内核= 8
每个周期的CPU指令= 8(考虑到AVX-256 - > 256位单位,可以容纳8个单精度值)x 2(像你说的那样添加和运算)= 16
全部放在一起:
2.9x8x16 = 371 GFlops / s