确定一个数字甚至使用Java的最有效方法是什么?为什么?
它会使用模数或减法,还是其他一些我没想过的方式?
有人想象我可以确定这是一个简单的测试课 - 而且我可以 - 但这真的无法解释原因,是吗?
我没有做一些疯狂的裤子性能调整,以实现更快地处理 许多项目的一些崇高目标。但我很好奇,如果一个方法应该优先于另一个方法作为常规做法。同样,我们不会使用&
代替&&
,为什么在我们可以使用%
时使用&
?
答案 0 :(得分:19)
如果检查这两种方法的热点7生成的程序集:
public static boolean isEvenBit(int i) {
return (i & 1) == 0;
}
public static boolean isEvenMod(int i) {
return i % 2 == 0;
}
你会看到虽然mod已经过优化,但基本上是按位and
,但它有一些额外的指令,因为这两个操作并不是严格等同的*。其他JVM可能以不同方式对其进行优化。大会在下面张贴以供参考。
我还运行了一个微基准测试来证实我们的观察结果:isEventBit稍微快一些(但是它们都运行在大约2 纳秒所以可能不会对整个典型程序产生太大的影响):
Benchmark Mode Samples Score Error Units
c.a.p.SO16969220.isEvenBit avgt 10 1.869 ± 0.069 ns/op
c.a.p.SO16969220.isEvenMod avgt 10 2.554 ± 0.142 ns/op
# {method} 'isEvenBit' '(I)Z' in 'javaapplication4/Test1'
# parm0: rdx = int
# [sp+0x20] (sp of caller)
0x00000000026c2580: sub rsp,0x18
0x00000000026c2587: mov QWORD PTR [rsp+0x10],rbp ;*synchronization entry
; - javaapplication4.Test1::isEvenBit@-1 (line 66)
0x00000000026c258c: and edx,0x1
0x00000000026c258f: mov eax,edx
0x00000000026c2591: xor eax,0x1 ;*ireturn
; - javaapplication4.Test1::isEvenBit@11 (line 66)
0x00000000026c2594: add rsp,0x10
0x00000000026c2598: pop rbp
0x00000000026c2599: test DWORD PTR [rip+0xfffffffffdb6da61],eax # 0x0000000000230000
; {poll_return}
0x00000000026c259f: ret
# {method} 'isEvenMod' '(I)Z' in 'javaapplication4/Test1'
# parm0: rdx = int
# [sp+0x20] (sp of caller)
0x00000000026c2780: sub rsp,0x18
0x00000000026c2787: mov QWORD PTR [rsp+0x10],rbp ;*synchronization entry
; - javaapplication4.Test1::isEvenMod@-1 (line 63)
0x00000000026c278c: mov r10d,edx
0x00000000026c278f: and r10d,0x1 ;*irem
; - javaapplication4.Test1::isEvenMod@2 (line 63)
0x00000000026c2793: mov r11d,r10d
0x00000000026c2796: neg r11d
0x00000000026c2799: test edx,edx
0x00000000026c279b: cmovl r10d,r11d
0x00000000026c279f: test r10d,r10d
0x00000000026c27a2: setne al
0x00000000026c27a5: movzx eax,al
0x00000000026c27a8: xor eax,0x1 ;*ireturn
; - javaapplication4.Test1::isEvenMod@11 (line 63)
0x00000000026c27ab: add rsp,0x10
0x00000000026c27af: pop rbp
0x00000000026c27b0: test DWORD PTR [rip+0xfffffffffdb6d84a],eax # 0x0000000000230000
; {poll_return}
0x00000000026c27b6: ret
*正如评论中指出的那样,%
并不是真正的模数;这是剩下的。如果(i % 2) != (i & 1)
,则为i < 0
。 isEvenMod
代码中的额外说明将结果的符号设置为i
的符号(然后将其与零进行比较,因此浪费了精力)。
答案 1 :(得分:5)
另一种方法是运行微基准测试并分析每个变体所花费的时间。结果如下:
Benchmark Mean Units Time vs. baseline
baseline 10.330 nsec/op 0.000
bitAnd 12.075 nsec/op 1.745
bitShift 12.309 nsec/op 1.979
modulo 12.309 nsec/op 4.529
(基线是一种只返回i == 0
)
<强>结论:强>
i & 1
-----&gt;需要大约1.75ns i << 31
- &gt;需要大约2.00ns i % 2
-----&gt;需要大约4.50ns 换句话说,i % 2
比i & 1
慢2倍。
注意:使用jmh完成基准测试。基线很高,因为我生成随机数以确保方法不被优化。测试使用热点7在i7 @ 2.8GHz(即一个周期= 0.35ns)上运行。
答案 2 :(得分:4)
TL; DR 按位和版本似乎是最快的。下面的基准和样本结果。
这应该比模数更快,因为它只有两个步骤可以直接在硬件中处理:
if ((n & 1) == 0) {
// even number here
}
这是一个微基准,证明了我和aasylias的观点:
// setup
int runs = 10;
int numbers = 200000000; // 200.000.000
int[] randomNumbers = new int[numbers];
Random random = new Random();
for (int i = 0; i < randomNumbers.length; i++) {
randomNumbers[i] = random.nextInt();
}
int even = 0;
int odd = 0;
// bitwiseAnd
long andStart = System.currentTimeMillis();
for (int i = 0; i < runs; i++) {
for (int number : randomNumbers) {
if ((number & 1) == 0)
even++;
else
odd++;
}
}
long andDone = System.currentTimeMillis();
long andDuration = andDone - andStart;
System.out.println("Even " + even + ", odd " + odd);
// reset variables
even = 0;
odd = 0;
// Modulo
long moduloStart = System.currentTimeMillis();
for (int i = 0; i < runs; i++) {
for (int number : randomNumbers) {
if (number % 2 == 0)
even++;
else
odd++;
}
}
long moduloDone = System.currentTimeMillis();
long moduloDuration = moduloDone - moduloStart;
// Done with modulo
System.out.println("Even " + even + ", odd " + odd);
// reset variables
even = 0;
odd = 0;
// Shift
long shiftStart = System.currentTimeMillis();
for (int i = 0; i < runs; i++) {
for (int number : randomNumbers) {
if ((number << 31) == 0)
even++;
else
odd++;
}
}
long shiftDone = System.currentTimeMillis();
long shiftDuration = shiftDone - shiftStart;
// Done with shift
System.out.println("Even " + even + ", odd " + odd);
System.out.println("Modulo Time " + moduloDuration);
System.out.println("Bitwise & Time " + andDuration);
System.out.println("Shift Time " + shiftDuration);
按位总是稍微快一点(即使你用模数块切换代码块)。样本输出:
Even 999999530, odd 1000000470
Even 999999530, odd 1000000470
Even 999999530, odd 1000000470
Modulo Time 17731
Bitwise & Time 9672
Shift Time 10638
答案 3 :(得分:4)
if ((i & 1) == 0) {
// Even
}