abs(v)比python中的(v + mask)^掩码更快?

时间:2015-12-07 09:21:57

标签: python

根据this page,计算中没有分支的整数绝对值(abs)的一种方法如下:

int v;           // we want to find the absolute value of v
unsigned int r;  // the result goes here 
int const mask = v >> sizeof(int) * CHAR_BIT - 1;

r = (v + mask) ^ mask;

出于好奇,我想将它与Python中的abs()函数进行比较:

> python -m timeit "v = -13" "r = abs(v)"
10000000 loops, best of 3: 0.119 usec per loop
> python -m timeit "v = -13" "mask = v >> 23" "r = (v + mask)^mask"
10000000 loops, best of 3: 0.18 usec per loop

abs()似乎比按位操作具有更好的性能。为什么?或者我在测试代码中遗漏了什么?

有关上述测试代码的更多信息:

mask = v >> 23,因为v的大小为24sys.getsizeof(v)

1 个答案:

答案 0 :(得分:3)

IPython Notebook简化了时间安排。 %%timeit之后的所有代码都是设置代码。我还将作业分配给v

%%timeit v = -13
abs(v)

10000000 loops, best of 3: 94.8 ns per loop


%%timeit v = -13;mask = v >> 23
(v + mask)^mask

1000000 loops, best of 3: 182 ns per loop

看起来abs的速度确实快了两倍。

查看字节代码有助于了解正在发生的事情:

import dis

代表abs

dis.dis("""
v = -13
r = abs(v)""")

 2           0 LOAD_CONST               2 (-13)
              3 STORE_NAME               0 (v)

  3           6 LOAD_NAME                1 (abs)
              9 LOAD_NAME                0 (v)
             12 CALL_FUNCTION            1 (1 positional, 0 keyword pair)
             15 STORE_NAME               2 (r)
             18 LOAD_CONST               1 (None)
             21 RETURN_VALUE

和其他方法:

dis.dis("""
v = -13
mask = v >> 23
r = (v + mask)^mask
""")

  2           0 LOAD_CONST               3 (-13)
              3 STORE_NAME               0 (v)

  3           6 LOAD_NAME                0 (v)
              9 LOAD_CONST               1 (23)
             12 BINARY_RSHIFT
             13 STORE_NAME               1 (mask)

  4          16 LOAD_NAME                0 (v)
             19 LOAD_NAME                1 (mask)
             22 BINARY_ADD
             23 LOAD_NAME                1 (mask)
             26 BINARY_XOR
             27 STORE_NAME               2 (r)
             30 LOAD_CONST               2 (None)
             33 RETURN_VALUE