使用中间变量而不是array.length会使你的for循环变得更快吗?

时间:2015-08-14 13:23:54

标签: java performance for-loop benchmarking bytecode

"Performance Tips" section in the Android documentation有一个非常大胆的主张:

  

one()更快。它将所有内容都拉到局部变量中,避免了查找。只有阵列长度才能提供性能优势。

引用此代码段:

int len = localArray.length;

for (int i = 0; i < len; ++i) {
    sum += localArray[i].mSplat;
}

这让我感到很惊讶,因为localArray.length只是访问一个整数,如果您使用中间变量,那么您必须再次执行相同的步骤。我们是否真的说过只需要转到x而不是y.x的中间变量更快?

我查看了this question,这是一个相同的想法,但使用了一个arraylist及其后续的.size()方法。这里的共识似乎是没有区别,因为方法调用可能只是内联到一个整数访问(这正是我们在这里的场景)。

所以我接受了字节码,看看是否可以告诉我任何事情。

给出以下源代码:

public void MethodOne() {
    int[] arr = new int[5];
    for (int i = 0; i < arr.length; i++) { }
}

public void MethodTwo() {
    int[] arr = new int[5];
    int len = arr.length;
    for (int i = 0; i < len; i++) { }
}

我得到以下字节码:

public void MethodOne();
    Code:
        0: iconst_5
        1: newarray       int
        3: astore_1
        4: iconst_0
        5: istore_2
        6: iload_2
        7: aload_1
        8: arraylength
        9: if_icmpge     18
        12: iinc          2, 1
        15: goto          6
        18: return

public void MethodTwo();
    Code:
        0: iconst_5
        1: newarray       int
        3: astore_1
        4: aload_1
        5: arraylength
        6: istore_2
        7: iconst_0
        8: istore_3
        9: iload_3
        10: iload_2
        11: if_icmpge     20
        14: iinc          3, 1
        17: goto          9
        20: return

它们在以下说明中有所不同:

方法一

6: iload_2
7: aload_1
8: arraylength
9: if_icmpge     18
12: iinc          2, 1
15: goto          6
18: return

方法二

9: iload_3
10: iload_2
11: if_icmpge     20
14: iinc          3, 1
17: goto          9
20: return

现在,我并非100%确定如何解释8: arraylength,但我认为只是表明您正在访问的字段。第一个方法加载索引计数器和数组并访问arraylength字段,而第二个方法加载索引计数器和中间变量。

我使用JMH(10次预热,10次迭代,5次分叉)对两种方法进行基准测试,这给出了以下基准测试结果:

c.m.m.Start.MethodOne    thrpt        50  3447184.351    19973.900   ops/ms
c.m.m.Start.MethodTwo    thrpt        50  3435112.281    32639.755   ops/ms

告诉我,这种差异可以忽略不计。

关于什么是Android文档声称在循环条件中使用中间变量?

2 个答案:

答案 0 :(得分:12)

你误解了文档。它们并不是指你所描述的(虽然我不怪你,但他们应该在这些文档中投入更多精力:)。

  

它将所有内容都移到局部变量中,避免了查找。

通过避免查找,他们引用field vs local variable access cost。访问字段(文档示例中的mArray)需要先加载this,然后根据this的固定偏移量加载字段。

过了一会儿,JIT可能会弄清楚发生了什么并优化了字段访问(如果字段不是volatile或者在循环中发生了某种其他形式的同步)并重写代码以便参与循环的所有变量都在CPU寄存器和缓存中被访问/更改,直到循环结束。

通常,JIT可能会更加有效地确定与存储在局部变量中的引用相比,优化对字段引用的数组长度的访问是否安全。假设我们有以下循环:

for (int i = 0; i < array.length; ++i) {
    process(array[i]);
}

如果array是一个字段并且process调用了数千行复杂代码,那么JIT可能会发现很难检查array字段是否在循环中的某处更改以引用其他一些长度不同的数组。

显然,在这种情况下检查局部变量是否更改(三行代码)要容易得多。

答案 1 :(得分:0)

实际上没有它没有使循环更快,你的想法是正确的使用String.length()
区别在于 array.length只是一个具有直接使用它的值的字段。
String.length()是一个需要时间执行的方法。