标签: flops
正如之前的帖子所说的那样wiki,“常春藤桥可以做”8 DP FLOP /周期:4宽AVX加+ 4宽AVX倍增“ 我在这里有点困惑,我知道常春藤桥没有FMA,AVX指令集可以做4 DP /周期,那么为什么4加+ 4乘法?