受此问题的启发: Why is it faster to process a sorted array than an unsorted array?
我写了自己的分支预测实验:
public class BranchPrediction {
public static void main(final String[] args) {
long start;
long sum = 0;
/* No branch */
start = System.nanoTime();
sum = 0;
for (long i = 0; i < 10000000000L; ++i)
sum += i;
System.out.println(System.nanoTime() - start);
System.out.println(sum);
/* With branch */
start = System.nanoTime();
sum = 0;
for (long i = 0; i < 10000000000L; ++i)
if (i >= 0)
sum += i;
System.out.println(System.nanoTime() - start);
System.out.println(sum);
/* No branch (again) */
start = System.nanoTime();
sum = 0;
for (long i = 0; i < 10000000000L; ++i)
sum += i;
System.out.println(System.nanoTime() - start);
System.out.println(sum);
/* With branch (again) */
start = System.nanoTime();
sum = 0;
for (long i = 0; i < 10000000000L; ++i)
if (i >= 0)
sum += i;
System.out.println(System.nanoTime() - start);
System.out.println(sum);
}
}
结果让我感到困惑:根据程序输出,带分支的循环比没有分支循环的循环可靠得快。
示例输出:
7949691477
-5340232226128654848
6947699555
-5340232226128654848
7920972795
-5340232226128654848
7055459799
-5340232226128654848
为什么会这样?
编辑:
答案 0 :(得分:2)
在我的其他机器(英特尔服务器和工作站)上运行相同的实验后,我可能会得出结论,我所经历的这种现象特定于笔记本电脑CPU(英特尔i7 Q740M)。
==== 6个月后编辑====
检查出来:http://eli.thegreenplace.net/2013/12/03/intel-i7-loop-performance-anomaly/
答案 1 :(得分:2)
请记住,JVM正在内部优化执行,并且PC内部有缓存可以使计算更快。由于您拥有如此强大的处理器(许多独立的核心),因此并不奇怪。另请注意,在Java代码下运行的代码映射到PC的机器代码。只需输入尽可能优化的代码,让JVM担心它。
编辑:大负载的机器和硬件,它们的运行效率更高。特别是缓存。