Intel Xeon E5- 2670 v2计算GFlops

时间:2016-04-08 07:14:22

标签: amazon-web-services instance ipc intel flops

如何计算处理器的GFlops:Intel Xeon E5-2670 v2 时钟速度:2.5 GHz vCPU:2 内存:7.5 GiB 存储:1 * 32 SSD 网络性能:中等(500 Mbps)

其aws实例类型:m3.large 我无法找到IPC并计算GFlops,因此我可以估算我的成本。 任何帮助都会很棒。

1 个答案:

答案 0 :(得分:0)

Xeon E5-xxxx v2是IvyBridge核心,因此它不支持FMA。有关IvyBridge管道的详细信息,请参阅Agner Fog's microarch pdf

如果您设法避免任何内存瓶颈,IvB可以维持每个时钟两个AVX向量FP操作的吞吐量。执行端口1可以运行vmulpsvaddps,但执行端口0只能运行vmulps

所以:2.5G时钟/秒* 2个FP矢量/时钟* 8个单精度元素/矢量

因此:使用AVX 256b载体的单精度40GFlop / sec理论最大值。双精度:20GFlop / sec(每256b载体4 DP元件)。

请注意,即使从L1缓存,IvB也只有128b加载/存储数据路径,并且只能支持2个加载和一个存储每2 时钟,对于256b向量。

mul有5c延迟,add有3c延迟,所以你需要足够的指令级并行性来同时保持5或10次乘法。