标签: x86 double bit-manipulation intel ieee
答案 0 :(得分:4)
来自Intel 64 and IA-32 Architectures Optimization Reference Manual,第14-14和14-15页,
ADDSD的延迟为5个周期,吞吐量为1个/周期。
ADDSD
DIVSD的延迟为62个周期,吞吐量为1/61周期。
DIVSD
因此,如果您的代码存在严重的数据依赖性问题,则添加速度比分区快12倍。但是,通过仔细优化,您可以比分割快61倍。其他因素可能会使差距更大。