Question

出于好奇，我看到将对象的id转换为其哈希的操作在字符串域中的操作，而不是像^，{{1}那样使用通常的按位操作}，|，&。

但正如您在下面看到的，下面的功能在某些时候是不正确的。我错过了什么？

class A:
    pass

def my_hash(a):
    bits = format(id(a), '064b')
    rot4 = bits[-4:] + bits[:-4]
    n = int(rot4, 2)
    return n

for _ in xrange(10):
    a = A()
    print hash(a) == my_hash(a), hash(a), my_hash(a)

Answer 1

哈希产生一个 signed 整数，你的代码产生一个无符号整数。

对于您的第一个错误结果，id(a)值为4357309288;那是64位的0000000000000000000000000000000100000011101101110100001101101000。最后4位是1000，将那些移到开头时给出二进制值1000000000000000000000000000000000010000001110110111010000110110，当被解释为2's complement signed integer时为--9223372036582443978，因为第一位，即符号位设置为1。

另一方面，

int(rot4, 2)始终将输入解释为无符号，无限长度整数，因此您得到9223372037127107638。

Python没有任何“简单”选项将包含二进制数的字符串解释为有符号整数，您可以使用bitstring库轻松实现：

>>> from bitstring import Bits
>>> bits = Bits(int=4357309288, length=64)
>>> bits[-4:]
Bits('0x8')
>>> bits[-4:] + bits[:-4]
Bits('0x80000000103b7436')
>>> (bits[-4:] + bits[:-4]).int
-9223372036582443978L
>>> (bits[-4:] + bits[:-4]).uint
9223372037127107638L

.int和.uint分别为您提供有符号和无符号整数解释。

使用bitstring我得到正确的输出：

>>> def my_hash(a):
...     bits = Bits(int=id(a), length=64)
...     return (bits[-4:] + bits[:-4]).int
...
>>> for _ in xrange(10):
...     a = A()
...     print hash(a) == my_hash(a), hash(a), my_hash(a)
...
True -9223372036585854145 -9223372036585854145
True 268921659 268921659
True -9223372036585854145 -9223372036585854145
True 268921659 268921659
True -9223372036585854145 -9223372036585854145
True 268921659 268921659
True -9223372036585854145 -9223372036585854145
True 268921659 268921659
True -9223372036585854145 -9223372036585854145
True 268921659 268921659

如果您想坚持使用标准库，请使用this Stack Overflow answer获取twos_comp()功能：

>>> twos_comp(9223372037127107638, 64)
-9223372036582443978L

您的功能将是：

def my_hash(a):
    bits = format(id(a), '064b')
    rot4 = bits[-4:] + bits[:-4]
    n = twos_comp(int(rot4, 2), 64)
    return n

在python中旋转位

1 个答案: