标签: architecture intel simd hpc fma
FMA操作(A * B + C)可以在intel的Haswell架构上完成5个周期。任何人都可以解释5个周期中每个周期发生的事情吗?对于乘法我知道阶段如下:
但我无法找到FMA操作的管道阶段
编辑:似乎以上不是Mult管道中使用的实际方法(感谢@EOF和@harold的单挑)