对于小型数组,为什么Arrays.copyOf比System.arraycopy快2倍?

时间:2017-06-11 18:33:05

标签: java arrays performance microbenchmark

我最近玩了一些基准测试,发现了非常有趣的结果,我现在无法解释。这是基准:

@BenchmarkMode(Mode.Throughput)
@Fork(1)
@State(Scope.Thread)
@Warmup(iterations = 10, time = 1, batchSize = 1000)
@Measurement(iterations = 10, time = 1, batchSize = 1000)
public class ArrayCopy {

    @Param({"1","5","10","100", "1000"})
    private int size;
    private int[] ar;

    @Setup
    public void setup() {
        ar = new int[size];
        for (int i = 0; i < size; i++) {
            ar[i] = i;
        }
    }

    @Benchmark
    public int[] SystemArrayCopy() {
        final int length = size;
        int[] result = new int[length];
        System.arraycopy(ar, 0, result, 0, length);
        return result;
    }

    @Benchmark
    public int[] javaArrayCopy() {
        final int length = size;
        int[] result = new int[length];
        for (int i = 0; i < length; i++) {
            result[i] = ar[i];
        }
        return result;
    }

    @Benchmark
    public int[] arraysCopyOf() {
        final int length = size;
        return Arrays.copyOf(ar, length);
    }

}

结果:

Benchmark                  (size)   Mode  Cnt       Score      Error  Units
ArrayCopy.SystemArrayCopy       1  thrpt   10   52533.503 ± 2938.553  ops/s
ArrayCopy.SystemArrayCopy       5  thrpt   10   52518.875 ± 4973.229  ops/s
ArrayCopy.SystemArrayCopy      10  thrpt   10   53527.400 ± 4291.669  ops/s
ArrayCopy.SystemArrayCopy     100  thrpt   10   18948.334 ±  929.156  ops/s
ArrayCopy.SystemArrayCopy    1000  thrpt   10    2782.739 ±  184.484  ops/s
ArrayCopy.arraysCopyOf          1  thrpt   10  111665.763 ± 8928.007  ops/s
ArrayCopy.arraysCopyOf          5  thrpt   10   97358.978 ± 5457.597  ops/s
ArrayCopy.arraysCopyOf         10  thrpt   10   93523.975 ± 9282.989  ops/s
ArrayCopy.arraysCopyOf        100  thrpt   10   19716.960 ±  728.051  ops/s
ArrayCopy.arraysCopyOf       1000  thrpt   10    1897.061 ±  242.788  ops/s
ArrayCopy.javaArrayCopy         1  thrpt   10   58053.872 ± 4955.749  ops/s
ArrayCopy.javaArrayCopy         5  thrpt   10   49708.647 ± 3579.826  ops/s
ArrayCopy.javaArrayCopy        10  thrpt   10   48111.857 ± 4603.024  ops/s
ArrayCopy.javaArrayCopy       100  thrpt   10   18768.866 ±  445.238  ops/s
ArrayCopy.javaArrayCopy      1000  thrpt   10    2462.207 ±  126.549  ops/s

所以这里有两件奇怪的事情:

  • Arrays.copyOfSystem.arraycopy小2倍 数组(1,5,10大小)。但是,在1000个大型数组上 Arrays.copyOf几乎慢了2倍。我知道两者 方法是内在的,所以我期望相同的性能。哪里 这种差异来自哪里?
  • 1元素数组的手动副本比System.arraycopy快。我不明白为什么。有人知道吗?

VM版本:JDK 1.8.0_131,VM 25.131-b11

1 个答案:

答案 0 :(得分:4)

您的SystemArrayCopy基准在语义上与arraysCopyOf不等。

如果你更换

将会是
    System.arraycopy(ar, 0, result, 0, length);

    System.arraycopy(ar, 0, result, 0, Math.min(ar.length, length));

通过这一改变,两个基准的表现也将变得相似。

为什么第一个变体会慢一些?

  1. 在不知道lengthar.length的关系时,JVM需要执行额外的边界检查,并准备在IndexOutOfBoundsException时抛出length > ar.length
  2. 这也打破了优化以消除冗余归零。你知道,每个分配的数组必须用零初始化。但是,如果JIT在创建后立即填充数组,则可以避免归零。但是-prof perfasm清楚地表明原始SystemArrayCopy基准测试花费了大量时间来清除已分配的数组:

     0,84%    0x000000000365d35f: shr    $0x3,%rcx
     0,06%    0x000000000365d363: add    $0xfffffffffffffffe,%rcx
     0,69%    0x000000000365d367: xor    %rax,%rax
              0x000000000365d36a: shl    $0x3,%rcx
    21,02%    0x000000000365d36e: rep rex.W stos %al,%es:(%rdi)  ;*newarray
    
  3. 小型数组的手动复制速度更快,因为与System.arraycopy不同,它不会对VM函数执行任何运行时调用。