应该在java字节码中可见乘法/位移优化

时间:2016-06-27 09:48:32

标签: java compilation bytecode

我一直在读取不需要位移,因为编译器优化会将乘法转换为位移。例如Should I bit-shift to divide by 2 in Java?Is shifting bits faster than multiplying and dividing in Java? .NET?

我在这里没有询问性能差异,我可以自己测试一下。但我认为很奇怪的是,有几个人提到它会“编译成同样的东西”。这似乎不是真的。我写了一小段代码。

private static void multi()
{
    int a = 3;
    int b = a * 2;
    System.out.println(b);
}

private static void shift()
{
    int a = 3;
    int b = a << 1L;
    System.out.println(b);
}

给出相同的结果,然后将其打印出来。

当我查看生成的Java字节码时,会显示以下内容。

private static void multi();
Code:
   0: iconst_3
   1: istore_0
   2: iload_0
   3: iconst_2
   4: imul
   5: istore_1
   6: getstatic     #4                  // Field java/lang/System.out:Ljava/io/PrintStream;
   9: iload_1
  10: invokevirtual #5                  // Method java/io/PrintStream.println:(I)V
  13: return

private static void shift();
Code:
   0: iconst_3
   1: istore_0
   2: iload_0
   3: iconst_1
   4: ishl
   5: istore_1
   6: getstatic     #4                  // Field java/lang/System.out:Ljava/io/PrintStream;
   9: iload_1
  10: invokevirtual #5                  // Method java/io/PrintStream.println:(I)V
  13: return

现在我们可以看到“imul”和“ishl”之间的区别。

我的问题是:显然,在java字节码中看不到口语优化。我仍然认为优化确实发生了,所以它只是发生在较低的水平吗?或者,或者因为它是Java,JVM在遇到imul语句时会以某种方式知道应该将其转换为其他内容。如果是这样的话,任何关于如何处理这些资源的资源都将非常赞赏。

(作为旁注,我并不是要证明需要进行位移。我认为这会降低可读性,至少对于习惯于Java的人来说,C ++可能会有所不同。我只是想看看优化发生在哪里)。

1 个答案:

答案 0 :(得分:5)

标题中的问题听起来与文中的问题略有不同。引用的声明,即移位和乘法将&#34;编译为相同的东西&#34; 是真的。但它还没有应用于字节码。

通常,Java字节码相当未优化。根本没有进行非常的优化 - 主要是内联的内联。除此之外,Java字节码只是原始程序的中间表示。从Java到Java字节码的翻译相当于#34;字面意思&#34;。

(我认为这是一件好事。字节码仍然非常类似于原始的Java代码。所有可能的细节(特定于平台!)优化都留给了虚拟机,这里有更多的选择。

所有进一步的优化,如算术优化,死代码消除或方法内联,都是由JIT(即时编译器)在运行时完成的。 Just-In-Time编译器还应用了通过位移替换乘法的优化。

由于多种原因,您提供的示例使得显示效果有点困难。由于内联和调用此方法的一般先决条件,方法中包含System.out.println的事实往往会使实际的机器代码变大。但更重要的是,移位1(对应于乘以2)也对应于将值加到自身上。因此,您不必在shl方法的结果机器代码中观察multi(左移)汇编程序指令,而是可能会在{{{{{}}中看到伪装的add指令1}} - 和multi方法。

然而,这是一个非常实用的例子,它左移8,对应于乘以256:

shift

(它接收要作为参数移位的值,以防止它被优化为常量。它多次调用方法,以触发JIT。它返回并从两个方法中收集值以防止方法调用进行优化。再次,这是非常实用的,但足以显示效果)

使用

在Hotspot反汇编程序VM中运行此程序
class BitShiftOptimization
{
    public static void main(String args[])
    {
        int blackHole = 0;
        for (int i=0; i<1000000; i++)
        {
            blackHole += testMulti(i);
            blackHole += testShift(i);
        }
        System.out.println(blackHole);

    }

    public static int testMulti(int a)
    {
        int b = a * 256;
        return b;
    }

    public static int testShift(int a)
    {
        int b = a << 8L;
        return b;
    }
}

将为java -server -XX:+UnlockDiagnosticVMOptions -XX:+TraceClassLoading -XX:+LogCompilation -XX:+PrintInlining -XX:+PrintAssembly BitShiftOptimization 方法生成以下汇编程序代码:

testMulti

(顺便说一下,Decoding compiled method 0x000000000286fbd0: Code: [Entry Point] [Verified Entry Point] [Constants] # {method} {0x000000001c0003b0} &apos;testMulti&apos; &apos;(I)I&apos; in &apos;BitShiftOptimization&apos; # parm0: rdx = int # [sp+0x40] (sp of caller) 0x000000000286fd20: mov %eax,-0x6000(%rsp) 0x000000000286fd27: push %rbp 0x000000000286fd28: sub $0x30,%rsp 0x000000000286fd2c: movabs $0x1c0005a8,%rax ; {metadata(method data for {method} {0x000000001c0003b0} &apos;testMulti&apos; &apos;(I)I&apos; in &apos;BitShiftOptimization&apos;)} 0x000000000286fd36: mov 0xdc(%rax),%esi 0x000000000286fd3c: add $0x8,%esi 0x000000000286fd3f: mov %esi,0xdc(%rax) 0x000000000286fd45: movabs $0x1c0003a8,%rax ; {metadata({method} {0x000000001c0003b0} &apos;testMulti&apos; &apos;(I)I&apos; in &apos;BitShiftOptimization&apos;)} 0x000000000286fd4f: and $0x1ff8,%esi 0x000000000286fd55: cmp $0x0,%esi 0x000000000286fd58: je 0x000000000286fd70 ;*iload_0 ; - BitShiftOptimization::testMulti@0 (line 17) 0x000000000286fd5e: shl $0x8,%edx 0x000000000286fd61: mov %rdx,%rax 0x000000000286fd64: add $0x30,%rsp 0x000000000286fd68: pop %rbp 0x000000000286fd69: test %eax,-0x273fc6f(%rip) # 0x0000000000130100 ; {poll_return} 0x000000000286fd6f: retq 0x000000000286fd70: mov %rax,0x8(%rsp) 0x000000000286fd75: movq $0xffffffffffffffff,(%rsp) 0x000000000286fd7d: callq 0x000000000285f160 ; OopMap{off=98} ;*synchronization entry ; - BitShiftOptimization::testMulti@-1 (line 17) ; {runtime_call} 0x000000000286fd82: jmp 0x000000000286fd5e 0x000000000286fd84: nop 0x000000000286fd85: nop 0x000000000286fd86: mov 0x2a8(%r15),%rax 0x000000000286fd8d: movabs $0x0,%r10 0x000000000286fd97: mov %r10,0x2a8(%r15) 0x000000000286fd9e: movabs $0x0,%r10 0x000000000286fda8: mov %r10,0x2b0(%r15) 0x000000000286fdaf: add $0x30,%rsp 0x000000000286fdb3: pop %rbp 0x000000000286fdb4: jmpq 0x0000000002859420 ; {runtime_call} 0x000000000286fdb9: hlt 0x000000000286fdba: hlt 0x000000000286fdbb: hlt 0x000000000286fdbc: hlt 0x000000000286fdbd: hlt 0x000000000286fdbe: hlt 方法的代码有相同的指令。

这里的相关行是

testShift

对应于左移8。