双散列函数返回错误的值

时间:2014-11-30 05:52:55

标签: c++ dictionary hash double-hashing

我正在创建一个双哈希映射,但插入后删除功能不起作用。我使用相同的格式来增加索引,但它没有达到正确的索引。

class RHHM {
    unsigned int hash2( int key ) {

        return key % (M-1) + 1;

    }

    //Private variables

    hashNode ** map;        //Backing array
    unsigned int M;   //Capacity of array

    //If index that key hashes to is empty, insert. Else, replace value at hashed index.
    int insert( int key, char value ) {

        int f = hash( key );
        int f2 = hash2 ( key );
        int p = 0;
        int h = f + (p * f2) % M;

        while( map[h] != NULL ) {

            if( p == M )
                return -1 * p;

            if( map[h]->key == key ) {
                map[h]->value = value;
                return p;
            }
            else {
                ++p;
                h = f + (p * f2) % M;
            }
        }

        map[h] = new hashNode( key, value );
        return p;
    }

int remove( int key, char &value) {

        int f = hash( key );
        int f2 = hash2 ( key );
        int p = 0;                         //Keeps track of how many indexes have been checked
        int h = f + (p * f2) % M;

        while( map[h] != NULL ) {

            if( p  == M )              //If item is not found in table, return false
                return -1 * p;

            if( key == map[h]->key )        //If key is found, break out of loop
                break;
            else {
                ++p;
                h = f + (p * f2) % M;  //Wrap around array if necessary
            }

        }

        if( map[h] == NULL )                //If end of cluster reached, return false
            return -1 * p;

        value = map[h]->value;              //Stores the value of the item to be deleted
        delete map[h];                      //Delete the item the user specified
        map[h] = NULL;
        ++p;
        h = f + (p * f2) % M;
        for( ; map[h] != NULL; h = f + (p * f2) % M) {     //While still in the cluster, remove and     reinsert all items
            int tempKey = map[h]->key;
            char tempValue = map[h]->value;
            delete map[h];
            map[h] = NULL;
            insert(tempKey, tempValue);
            ++p;
        }
        return p;

    }

}

这是我的主要内容:

RHHM bh(10);
bh.insert(0, 'A');
bh.insert(10, 'B');
bh.insert(20, 'C');
bh.print(std::cout);

输出:

<[ 0:A, - , 10:B, 20:C, - , - , - , - , - , - ]>

如您所见,第一个索引哈希值为0。由于10密钥与0冲突,因此双哈希(10)应散列到1,但散列为2。 为什么它返回错误的值?

1 个答案:

答案 0 :(得分:0)

这是因为hash2函数为键10返回值2.对于hash2(10),hash2可以显示为。

return 10 % (10-1) + 1

这又由运算符优先级计算为值2为。

return (10 %(10-1))+1

并且在插入函数中发生冲突时,将hash2值添加到哈希值以获取计算为的新索引。

h= f + ( P * f2 ) % M
h= 0 + (1 * 2 ) % 10 \\ this evaluates to 2.

这就是为什么你把新索引变为2。

编辑:代码在运算符优先级方面存在一些问题。 第一      h = f +(p * f2)%M; //必要时包裹数组

这并不包围数组。因为%优先于+。 f具有[0-M-1]范围内的值,并且(p * f2)%M具有范围[0-M-1]中的值。因此,上述表达式可以评估范围[0-2 * M-2]中的值。这适用于代码中的其他此类表达式。这是哈希表中可能缺少某些键的原因。