我有一个Java性能问题,我不明白

时间:2012-01-12 17:28:25

标签: java performance

我写了一些代码来制作一个多维数组,而不是一个数组数组,这样我就可以节省一些内存。然后我运行了一些测试,将它的速度与常规Java数组(int [] [])的速度进行比较,因为我不希望程序运行得更慢,即使它节省了一些内存。我在时间测试中看到的让我感到困惑。以下是测试运行的典型结果。时间是相同的代码。注意最后两个比前四个要大得多。

  

时间:58343722 ns
  时间:59451156 ns
  时间:51374777 ns

     

时间:61777424 ns
  时间:813156695 ns
  时间:782140511 ns

现在我想到的第一件事是垃圾收集器踢了什么。我将内存限制提高到5GB(-Xmx5g),这样垃圾收集器就会无法启动。没有改变。我动了一下,但模式仍然存在。

那么模式是什么?在前三次,代码位在一个函数中,我称之为三次。在第二次三次中,代码位在单个函数中重复三次。因此,模式是每当代码位在同一个函数中运行多次时,运行代码位所需的时间将从第二位代码开始,然后保持在那里。

我确实找到了一个可以产生这样结果的改动:

  

时间:58729424 ns
  时间:59965426 ns
  时间:51441618 ns

     

时间:57359741 ns
  时间:65362705 ns
  时间:857942387 ns

我所做的是在后三个的代码位之间添加一毫秒的延迟。这样做只会加速块中的第二个代码位,没有任何延迟会加速后面的任何代码位。

坦率地说,我很困惑。我无法解释这种行为。有人可以了解正在发生的事情吗?

以下是代码:

package multidimensionalarraytests;

import java.lang.reflect.Array;
import java.util.logging.Level;
import java.util.logging.Logger;

public class MultidimensionalArrayTests {
    static ArrayInt2Dv1 array=new ArrayInt2Dv1(10000,10000);

    public static void main(String[] args) {
        System.out.println("ignore the warmup");
        test();
        test();
        combined();
        combined();

        System.out.println("running tests");
        test();
        test();
        test();
        System.out.println();
        combined();
    }

    static long test(){
        int value=1;
        long start,stop,time;

        System.out.print("time: ");
        start=System.nanoTime();
        for(int x=0;x<array.length1;x++){
            for(int y=0;y<array.length2;y++){
                array.set(x, y, value);
                value=array.get(x, y);
            }   
        }
        stop=System.nanoTime();
        time=(stop-start);
        System.out.println(time+" ns");
        return time;
    }

    static void combined(){
        int value=1;
        long start,stop,time;

        System.out.print("time: ");
        start=System.nanoTime();
        for(int x=0;x<array.length1;x++){
            for(int y=0;y<array.length2;y++){
                array.set(x, y, value);
                value=array.get(x, y);
            }   
        }
        stop=System.nanoTime();
        time=(stop-start);
        System.out.println(time+" ns");

        //try {Thread.sleep(1);} catch (InterruptedException ex) {}

        System.out.print("time: ");
        start=System.nanoTime();
        for(int x=0;x<array.length1;x++){
            for(int y=0;y<array.length2;y++){
                array.set(x, y, value);
                value=array.get(x, y);
            }   
        }
        stop=System.nanoTime();
        time=(stop-start);
        System.out.println(time+" ns");

        //try {Thread.sleep(60000);} catch (InterruptedException ex) {}

        System.out.print("time: ");
        start=System.nanoTime();
        for(int x=0;x<array.length1;x++){
            for(int y=0;y<array.length2;y++){
                array.set(x, y, value);
                value=array.get(x, y);
            }   
        }
        stop=System.nanoTime();
        time=(stop-start);
        System.out.println(time+" ns");     
    }
}

package multidimensionalarraytests;

public class ArrayInt2Dv1 {
    int [] array;

    public final int length1;
    public final int length2;

    public ArrayInt2Dv1(int length1, int length2){
        this.length1=length1;
        this.length2=length2;
        array=new int[length1*length2];
    }

    public int get(int x,int y){
        return array[x*length2+y];
    }

    public void set(int x,int y,int value){
        array[x*length2+y]=value;
    }
}

--- ---编辑

Windows 7上的输出选项-Xms5g -Xmx5g -XX:+ PrintCompilation -verbose:gc -XX:CICompilerCount = 1 -Xbatch

time:     299    1    b        multidimensionalarraytests.ArrayInt2Dv1::set (15 bytes)
    302    2    b        multidimensionalarraytests.ArrayInt2Dv1::get (14 bytes)
    303    1 %  b        multidimensionalarraytests.MultidimensionalArrayTests::test @ 31 (114 bytes)
    358    1 %           multidimensionalarraytests.MultidimensionalArrayTests::test @ -2 (114 bytes)   made not entrant
60671451 ns
    359    3    b        multidimensionalarraytests.MultidimensionalArrayTests::test (114 bytes)
time:     365    2 %  b        multidimensionalarraytests.MultidimensionalArrayTests::test @ 31 (114 bytes)
58104484 ns
time:     425    3 %  b        multidimensionalarraytests.MultidimensionalArrayTests::combined @ 31 (330 bytes)
69008251 ns
time: 806898159 ns
time: 845447596 ns
   2146    4    b        multidimensionalarraytests.MultidimensionalArrayTests::combined (330 bytes)
time: 52493169 ns
time: 804304528 ns
time: 845500191 ns
running tests
time: 51290771 ns
time: 51922285 ns
time: 51264108 ns

time: 52258679 ns
time: 842229025 ns
time: 871403625 ns

在Linux(同一台机器上的VirtualBox上的Ubuntu)上使用相同的选项:

    283   1   b   java.lang.String::hashCode (60 bytes)
    285   2   b   sun.nio.cs.UTF_8$Encoder::encodeArrayLoop (490 bytes)
    287   3   b   java.lang.String::charAt (33 bytes)
    287   4   b   java.lang.String::indexOf (151 bytes)
    297   5   b   java.io.UnixFileSystem::normalize (75 bytes)
   2850   6   b   java.lang.String::lastIndexOf (156 bytes)
ignore the warmup
time:    5885   7   b   multidimensionalarraytests.ArrayInt2Dv1::set (15 bytes)
   5948   8   b   multidimensionalarraytests.ArrayInt2Dv1::get (14 bytes)
   5949   1%  b   multidimensionalarraytests.MultidimensionalArrayTests::test @ 31 (114 bytes)
11529998483 ns
  17565   9   b   multidimensionalarraytests.MultidimensionalArrayTests::test (114 bytes)
time: 1619622928 ns
time:   19718   2%  b   multidimensionalarraytests.MultidimensionalArrayTests::combined @ 31 (330 bytes)
475786382 ns
time: 288586857 ns
time: 315560700 ns
  20789  10   b   multidimensionalarraytests.MultidimensionalArrayTests::combined (330 bytes)
time: 460577230 ns
time: 311525066 ns
time: 312343429 ns
running tests
time: 310261854 ns
time: 298826592 ns
time: 304689920 ns

time: 315416579 ns
time: 299473245 ns
time: 290211350 ns

1 个答案:

答案 0 :(得分:6)

尝试-XX:+PrintCompilation这应该表明在第一个循环迭代10000次后整个方法已经过优化。问题是第二个/第三个循环被优化而没有统计/计数器信息。有时候这没关系,有时后面的循环要慢得多,如果你交换循环的顺序,后面的循环会改善,第一个循环会变慢。

解决这个问题的简单方法是将每个循环放在自己的方法中,每个循环都会得到适当的优化。