我刚开始使用numpy
及其matrix
模块(非常有用!),我想使用矩阵对象作为字典的键,所以我检查了{{ 1}}已实施matrix
方法:
__hash__
确实如此!很好,所以这意味着它可以成为字典的关键:
>>> from numpy import matrix
>>> hasattr(matrix, '__hash__')
True
工作!现在,让我们继续测试:
>>> m1 = matrix('1 2 3; 4 5 6; 7 8 9')
>>> m1
matrix([[1, 2, 3],
[4, 5, 6],
[7, 8, 9]])
>>> m2 = matrix('1 0 0; 0 1 0; 0 0 1')
>>> m2
matrix([[1, 0, 0],
[0, 1, 0],
[0, 0, 1]])
>>> matrix_dict = {m1: 'first', m2: 'second'}
什么?因此,它适用于相同的矩阵,但它不适用于具有完全相同内容的另一个矩阵?让我们看看>>> matrix_dict[m1]
'first'
>>> matrix_dict[matrix('1 2 3; 4 5 6; 7 8 9')]
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
KeyError: matrix([[1, 2, 3],
[4, 5, 6],
[7, 8, 9]])
返回的内容:
__hash__
因此,来自>>> hash(m1)
2777620
>>> same_as_m = matrix('1 2 3; 4 5 6; 7 8 9')
>>> hash(same_as_m)
-9223372036851998151
>>> hash(matrix('1 2 3; 4 5 6; 7 8 9')) # same as m too
2777665
的{{1}}的{{1}}方法会为同一__hash__
返回不同的值。
这是对的吗?那么,这是否意味着它不能用作字典键?如果它无法使用,为什么它已经实现了matrix
?
答案 0 :(得分:9)
将可变对象用作字典的键是错误的,因为它的哈希值应在您更改数据后立即更改,但插入时使用的值将保留。
在我的测试中,numpy在Python 3.2.2引发了一个TypeError:
TypeError: unhashable type: 'matrix'
但是在Python 2.7上它仍然允许散列,但是当你更改数据时散列值永远不会改变,所以它作为字典键是没用的,因为添加到具有相同散列的字典的许多matrix
对象将降低哈希表所以插入将是O(n^2)
而不是O(1)
。
也许他们没有删除哈希值以避免在Python 2.x上破坏某些API,但不依赖它!