Question

受此问题的启发： Why is it faster to process a sorted array than an unsorted array?

我写了自己的分支预测实验：

public class BranchPrediction {
    public static void main(final String[] args) {
        long start;
        long sum = 0;

        /* No branch */
        start = System.nanoTime();
        sum = 0;
        for (long i = 0; i < 10000000000L; ++i)
            sum += i;
        System.out.println(System.nanoTime() - start);
        System.out.println(sum);

        /* With branch */
        start = System.nanoTime();
        sum = 0;
        for (long i = 0; i < 10000000000L; ++i)
            if (i >= 0)
                sum += i;
        System.out.println(System.nanoTime() - start);
        System.out.println(sum);

        /* No branch (again) */
        start = System.nanoTime();
        sum = 0;
        for (long i = 0; i < 10000000000L; ++i)
            sum += i;
        System.out.println(System.nanoTime() - start);
        System.out.println(sum);

        /* With branch (again) */
        start = System.nanoTime();
        sum = 0;
        for (long i = 0; i < 10000000000L; ++i)
            if (i >= 0)
                sum += i;
        System.out.println(System.nanoTime() - start);
        System.out.println(sum);
    }
}

结果让我感到困惑：根据程序输出，带分支的循环比没有分支循环的循环可靠得快。

示例输出：

7949691477
-5340232226128654848
6947699555
-5340232226128654848
7920972795
-5340232226128654848
7055459799
-5340232226128654848

为什么会这样？

编辑：

反汇编类显示Java编译器未优化（遗漏）任何内容（https://gist.github.com/HouzuoGuo/5692424）
Why is it faster to process a sorted array than an unsorted array?作者使用的Java基准技术与我的相同。
该机器是Intel核心i7，运行Linux 3.2 64位和Oracle JVM 1.7 64位
当我超过循环迭代次数时，with-branch循环比非分支循环运行多SECONDS。

Answer 1

在我的其他机器（英特尔服务器和工作站）上运行相同的实验后，我可能会得出结论，我所经历的这种现象特定于笔记本电脑CPU（英特尔i7 Q740M）。

==== 6个月后编辑====

检查出来：http://eli.thegreenplace.net/2013/12/03/intel-i7-loop-performance-anomaly/

Answer 2

请记住，JVM正在内部优化执行，并且PC内部有缓存可以使计算更快。由于您拥有如此强大的处理器（许多独立的核心），因此并不奇怪。另请注意，在Java代码下运行的代码映射到PC的机器代码。只需输入尽可能优化的代码，让JVM担心它。

编辑：大负载的机器和硬件，它们的运行效率更高。特别是缓存。

为什么分支预测比没有分支更快？

2 个答案: