众所周知,英特尔x86_64处理器是超标量体系结构和流水线架构。 有一个真正有效的例子,它显示了x86_64上超标量体系结构的ILP(指令级并行)的好处,因为有4个独立计算流。 Is there a really working example which showing the benefits of ILP(Instruction-Level Parallelism) on x86_64?
但是有没有一个真正有效的例子,它展示了x86_64上管道架构的ILP(指令级并行)的好处?
即。是否有一个带有两个asm / C / C ++的示例 - 具有相同结果但具有不同实现和不同性能的函数?除了使用:循环展开,SIMD,多线程。