如何从哈希表中的线性探测转换为二次探测?

时间:2018-05-20 12:54:52

标签: python hashtable quadratic-probing

您好我是python的新手,我有一个哈希表,它使用线性探测来解决冲突。我知道线性探针是N + 1,N + 2,N + 3,但是二次探针是n + 1,n + 4,n + 9 ...... 这是线性探针的设定项功能

def __setitem__(self, key, value):
    position = self.hash_value(key)
    for _ in range(self.table_size):
        if self.array[position] is None:#found empty slot
            self.array[position] = (key, value)
            self.count += 1
            return
        elif self.array[position][0] == key:#found key
            self.array[position] = (key, value)#update value
            return
        else:#not found try next
            position = (position+1) % self.table_size
    raise ValueError("Table is Full!")

要将其转换为二次探测,我尝试将位置更改为

position = (position+(i+1)**2) % self.table_size

但显然这是错误的,因为二次索引被添加到最后位置而不是原始位置?任何帮助都会被贬低!

1 个答案:

答案 0 :(得分:2)

如果您注意到二次数序列:1, 4, 9, 16, 25, ...,您会注意到连续元素之间的差异为3, 5, 7, 9,即奇数。因此,您可以使用变量i作为计数器/索引,并使用它来增加下一次迭代的位置,如下所示:

position = (position + (2 * i + 1)) % self.table_size

其中position是刚用于当前迭代的索引。

expected    |  i  |    new_position
1           |  0  |     0 + (2 * 0 + 1) = 1
4           |  1  |     1 + (2 * 1 + 1) = 4
9           |  2  |     4 + (2 * 2 + 1) = 9
16          |  3  |     9 + (2 * 3 + 1) = 16
25          |  4  |    16 + (2 * 4 + 1) = 25

但是,您需要修改增加i的次数。一个常见的选择是只使用表长度,但你应该知道,在二次探测中,有可能在表中找不到有效索引,即使它只是迭代table_length次而存在,有时它甚至可能找不到它,即使你继续探索。因此,您必须小心设置探测单个操作的次数的适当限制

或者,您可以跟踪第一个计算/哈希值索引并始终将position计算为:

current_position = original_position + i**2