根据this page,计算c中没有分支的整数绝对值(abs
)的一种方法如下:
int v; // we want to find the absolute value of v
unsigned int r; // the result goes here
int const mask = v >> sizeof(int) * CHAR_BIT - 1;
r = (v + mask) ^ mask;
出于好奇,我想将它与Python中的abs()
函数进行比较:
> python -m timeit "v = -13" "r = abs(v)"
10000000 loops, best of 3: 0.119 usec per loop
> python -m timeit "v = -13" "mask = v >> 23" "r = (v + mask)^mask"
10000000 loops, best of 3: 0.18 usec per loop
abs()
似乎比按位操作具有更好的性能。为什么?或者我在测试代码中遗漏了什么?
有关上述测试代码的更多信息:
mask = v >> 23
,因为v
的大小为24
到sys.getsizeof(v)
。
答案 0 :(得分:3)
IPython Notebook简化了时间安排。 %%timeit
之后的所有代码都是设置代码。我还将作业分配给v
:
%%timeit v = -13
abs(v)
10000000 loops, best of 3: 94.8 ns per loop
%%timeit v = -13;mask = v >> 23
(v + mask)^mask
1000000 loops, best of 3: 182 ns per loop
看起来abs
的速度确实快了两倍。
查看字节代码有助于了解正在发生的事情:
import dis
代表abs
:
dis.dis("""
v = -13
r = abs(v)""")
2 0 LOAD_CONST 2 (-13)
3 STORE_NAME 0 (v)
3 6 LOAD_NAME 1 (abs)
9 LOAD_NAME 0 (v)
12 CALL_FUNCTION 1 (1 positional, 0 keyword pair)
15 STORE_NAME 2 (r)
18 LOAD_CONST 1 (None)
21 RETURN_VALUE
和其他方法:
dis.dis("""
v = -13
mask = v >> 23
r = (v + mask)^mask
""")
2 0 LOAD_CONST 3 (-13)
3 STORE_NAME 0 (v)
3 6 LOAD_NAME 0 (v)
9 LOAD_CONST 1 (23)
12 BINARY_RSHIFT
13 STORE_NAME 1 (mask)
4 16 LOAD_NAME 0 (v)
19 LOAD_NAME 1 (mask)
22 BINARY_ADD
23 LOAD_NAME 1 (mask)
26 BINARY_XOR
27 STORE_NAME 2 (r)
30 LOAD_CONST 2 (None)
33 RETURN_VALUE