哈希函数精度问题

时间:2020-06-27 15:42:48

标签: c hashtable cs50 hash-function

我正在编写一个拼写检查单词的程序,但是我的哈希函数没有为相同的单词返回相同的数字。

我的问题是我的哈希函数如何针对相同的输入不返回相同的哈希值。

这是我的问题的最小重现示例:

// Implements a dictionary's functionality

#define HASHTABLE_SIZE 65536

// Represents a node in a hash table
typedef struct node
{
    char word[LENGTH + 1];
    struct node *next;
}
node;

// Number of buckets in hash table
const unsigned int N = HASHTABLE_SIZE;

// Hash table
node *table[N];
unsigned int totalWords = 0;

// Hashes word to a number
unsigned int hash(const char *word)
{
    unsigned int hash_value;

    for (int i=0, n=strlen(word); i<n; i++)
        hash_value = (hash_value << 2) ^ word[i];

    return hash_value % HASHTABLE_SIZE;
}

2 个答案:

答案 0 :(得分:2)

哈希函数中的

hash_value未初始化,并且造成内存破坏,从而导致不可预测的结果。在引用的帖子中:

unsigned int hash = 0;

答案 1 :(得分:1)

您的fscanf写入由word指向的该存储块的外部。

    char *word = malloc(LENGTH);  // this is too small to hold a word + '\0'
    ...
    while (fscanf(dicfile, "%s", word) != EOF)
    {

将大小增加到LENGTH+1