当JVM不执行代码优化方法时

时间:2015-04-17 06:49:12

标签: java jvm

我正在阅读书籍#34; Java Performance"作者:Scott Oaks并且遇到了一个代码,据说Java 7或8 JVM足够聪明,可以跳过for循环中提供的计算部分,因为将来不会使用结果(Microbenchmarking)。

书中提到的代码:

public void doTest() {
    // Main Loop
    double l;
    long then = System.currentTimeMillis();

    for (int i = 0; i < nLoops; i++) {
        l = fibImpl1(50);
    }
    long now = System.currentTimeMillis();
    System.out.println("Elapsed time: " + (now - then));
}

private double fibImpl1(int n) {
   if (n < 0) throw new IllegalArgumentException("Must be > 0");
   if (n == 0) return 0d;
   if (n == 1) return 1d;
   double d = fibImpl1(n - 2) + fibImpl(n - 1);
   if (Double.isInfinite(d)) throw new ArithmeticException("Overflow");
  return d;
} 

书中的进一步陈述: 由于从不使用Fibonacci计算的结果,编译器可以自由地丢弃该计算。智能编译器(包括当前的Java 7和8编译器)将最终执行此代码:

long then = System.currentTimeMillis();
long now = System.currentTimeMillis();
System.out.println("Elapsed time: " + (now - then));

为了验证相同,我尝试了一个代码,但经过时间计算并没有反映出上面解释的理论。

我的代码版本:

    public class APSum {

    public static void main(String[] args) {

        long then = System.currentTimeMillis();
        ArithmeticProgression.sum(500000000);
        long now = System.currentTimeMillis();
        System.out.println("Elapsed time: " + (now - then));
    }
}

    class ArithmeticProgression{
    public static double sum(int i){
        double sum=0;
        for(int index=0; index<=i; index++){
            sum = sum + (double)index;
        }
        return sum;
    }
}

所以,请让我知道如何实现书中提到的场景。或者JVM是否希望JVM是否想要优化呼叫?

1 个答案:

答案 0 :(得分:2)

现代JVM过于复杂,需要进行各种优化。如果您尝试测量一小段代码,那么在没有非常,非常详细了解JVM正在做什么的情况下正确执行它是非常复杂的。死代码消除(DCE)是一种经常导致微基准测试失误的优化。

有两个经典错误(详细了解常见错误http://shipilev.net/talks/jvmls-July2014-benchmarking.pdfhttps://stackoverflow.com/a/513259/1352098):

  • 由于最小的编译单位是方法,因此基准必须有多个主要方法。
  • 没有热身迭代。始终包括一个热备阶段,它一直运行测试内核,足以在计时阶段之前触发所有初始化和编译。

修正后,我们的基准测试如下:

    public class APSum {

    public static void main(String[] args) {
        for (int i = 0; i < 5000; i++) {
            test();
        }
    }

    private static void test() {
        long then = System.currentTimeMillis();
        sum(5000000);
        long now = System.currentTimeMillis();
        System.out.println("Elapsed time: " + (now - then));
    }

    public static double sum(int i){
        double sum=0;
        for(int index=0; index<=i; index++){
            sum = sum + (double)index;
        }
        return sum;
    }
    }

在此示例中,DCE仅在内联后发生。让我们先看一下内联树(-XX:+UnlockDiagnosticVMOptions -XX:+PrintInlining -XX:-BackgroundCompilation

   @ 0   java.lang.System::currentTimeMillis (0 bytes)   intrinsic
   @ 6   edu.jvm.runtime.APSum::sum (22 bytes)   inlining prohibited by policy
   @ 10   java.lang.System::currentTimeMillis (0 bytes)   intrinsic

由于OSR,编译器无法内联方法APSum :: sum。实际上,尽管OSR compilation经常在基准测试中触发(特别是在微基准测试中),但在应用程序代码中触发频率较低。为了获得正确的结果,我们必须添加更多的预热迭代:

    public class APSum {

    public static void main(String[] args) {
        for (int i = 0; i < 10000; i++) {
            test();
        }
    }

    private static void test() {
        long then = System.currentTimeMillis();
        sum(5000000);
        long now = System.currentTimeMillis();
        System.out.println("Elapsed time: " + (now - then));
    }

    public static double sum(int i){
        double sum=0;
        for(int index=0; index<=i; index++){
            sum = sum + (double)index;
        }
        return sum;
    }
    }

在迭代结束时,我们有:

  Elapsed time: 5
  Elapsed time: 4
  Elapsed time: 5

    @ 0   java.lang.System::currentTimeMillis (0 bytes)   (intrinsic)
    @ 6   edu.jvm.runtime.APSum::sum (22 bytes)   inline (hot)
    @ 10   java.lang.System::currentTimeMillis (0 bytes)   (intrinsic)

  Elapsed time: 0
  Elapsed time: 0
  Elapsed time: 0