使用Python的Base-2(二进制)表示

时间:2008-10-09 13:38:33

标签: python

How Do You Express Binary Literals in Python的基础上,我正在考虑采用合理,直观的方式来实现以基础2形式显示整数的编程101板栗。这是我提出的最好的,但我想用更好的算法替换它,或者至少一个应该具有尖叫 - 快速性能的算法。

def num_bin(N, places=8):
    def bit_at_p(N, p):
        ''' find the bit at place p for number n '''
        two_p = 1 << p   # 2 ^ p, using bitshift, will have exactly one
                         # bit set, at place p
        x = N & two_p    # binary composition, will be one where *both* numbers
                         # have a 1 at that bit.  this can only happen 
                         # at position p.  will yield  two_p if  N has a 1 at 
                         # bit p
        return int(x > 0)

    bits =  ( bit_at_p(N,x) for x in xrange(places))
    return "".join( (str(x) for x in bits) )

    # or, more consisely 
    # return "".join([str(int((N & 1 << x)>0)) for x in xrange(places)])

2 个答案:

答案 0 :(得分:13)

为了获得最佳效率,您通常希望一次处理多个位。 您可以使用一种简单的方法来获得固定宽度的二进制表示。例如

def _bin(x, width):
    return ''.join(str((x>>i)&1) for i in xrange(width-1,-1,-1))

_bin(x,8)现在将给出x的低8位的零填充表示。这可用于构建查找表,允许您的转换器一次处理8位(如果您想将内存用于它,则可以更多)。

_conv_table = [_bin(x,8) for x in range(256)]

然后你可以在你的真实函数中使用它,在返回它时去除前导零。我还添加了对有符号数的处理,因为没有它你会得到一个无限循环(负整数在概念上有无限数量的设置符号位。)

def bin(x):
    if x == 0: 
        return '0' #Special case: Don't strip leading zero if no other digits
    elif x < 0:
        sign='-'
        x*=-1
    else:
        sign = ''
    l=[]
    while x:
        l.append(_conv_table[x & 0xff])
        x >>= 8
    return sign + ''.join(reversed(l)).lstrip("0")

[编辑]更改了处理有符号整数的代码 [Edit2]以下是各种解决方案的一些时序图。 bin是上面的函数,constantin_bin来自Constantin's answer,num_bin是原始版本。出于好奇,我还尝试了上面的16位查找表变体(下面的bin16),并尝试了Python3的内置bin()函数。所有时间均使用01010101位模式进行100000次运行。

Num Bits:              8       16       32       64      128      256
---------------------------------------------------------------------
bin                0.544    0.586    0.744    1.942    1.854    3.357 
bin16              0.542    0.494    0.592    0.773    1.150    1.886
constantin_bin     2.238    3.803    7.794   17.869   34.636   94.799
num_bin            3.712    5.693   12.086   32.566   67.523  128.565
Python3's bin      0.079    0.045    0.062    0.069    0.212    0.201 

正如你所看到的,当使用大块处理长值时,确实可以获得回报,但是没有什么比python3内置的低级C代码更好(奇怪的是,它似乎始终比256位快128位!)。使用16位查找表可以改善一些事情,但除非你真的需要它,否则可能是不值得的,因为它占用了大量的内存,并且可以引入一个小但是非常规的启动延迟来预先计算表。

答案 1 :(得分:3)

不要尖叫 - 快速,但直截了当:

>>> def bin(x):
...     sign = '-' if x < 0 else ''
...     x = abs(x)
...     bits = []
...     while x:
...             x, rmost = divmod(x, 2)
...             bits.append(rmost)
...     return sign + ''.join(str(b) for b in reversed(bits or [0]))

它也比num_bin

>>> import timeit
>>> t_bin = timeit.Timer('bin(0xf0)', 'from __main__ import bin')
>>> print t_bin.timeit(number=100000)
4.19453350997
>>> t_num_bin = timeit.Timer('num_bin(0xf0)', 'from __main__ import num_bin')
>>> print t_num_bin.timeit(number=100000)
4.70694716882

更重要的是,它实际上正常工作(对于我对“正确性”的定义:)):

>>> bin(1)
'1'
>>> num_bin(1)
'10000000'