我对哈希表的实现有一个C编程问题。我已经实现了哈希表来存储一些字符串。 我在处理哈希冲突时遇到了问题。我遵循链接链接列表方法来克服这个问题,但不知何故,我的代码表现不同。我无法调试它。有人可以帮忙吗?
这就是我所面对的: 说第一次,我插入一个名为gaur的字符串。我的哈希映射计算索引为0并成功插入字符串。但是,当另一个字符串的哈希值在计算时结果为0时,我的先前值被覆盖,即gaur将被新字符串替换。
这是我的代码:
struct list
{
char *string;
struct list *next;
};
struct hash_table
{
int size; /* the size of the table */
struct list **table; /* the table elements */
};
struct hash_table *create_hash_table(int size)
{
struct hash_table *new_table;
int i;
if (size<1) return NULL; /* invalid size for table */
/* Attempt to allocate memory for the table structure */
if ((new_table = malloc(sizeof(struct hash_table))) == NULL) {
return NULL;
}
/* Attempt to allocate memory for the table itself */
if ((new_table->table = malloc(sizeof(struct list *) * size)) == NULL) {
return NULL;
}
/* Initialize the elements of the table */
for(i=0; i<size; i++)
new_table->table[i] = '\0';
/* Set the table's size */
new_table->size = size;
return new_table;
}
unsigned int hash(struct hash_table *hashtable, char *str)
{
unsigned int hashval = 0;
int i = 0;
for(; *str != '\0'; str++)
{
hashval += str[i];
i++;
}
return (hashval % hashtable->size);
}
struct list *lookup_string(struct hash_table *hashtable, char *str)
{
printf("\n enters in lookup_string \n");
struct list * new_list;
unsigned int hashval = hash(hashtable, str);
/* Go to the correct list based on the hash value and see if str is
* in the list. If it is, return return a pointer to the list element.
* If it isn't, the item isn't in the table, so return NULL.
*/
for(new_list = hashtable->table[hashval]; new_list != NULL;new_list = new_list->next)
{
if (strcmp(str, new_list->string) == 0)
return new_list;
}
printf("\n returns NULL in lookup_string \n");
return NULL;
}
int add_string(struct hash_table *hashtable, char *str)
{
printf("\n enters in add_string \n");
struct list *new_list;
struct list *current_list;
unsigned int hashval = hash(hashtable, str);
printf("\n hashval = %d", hashval);
/* Attempt to allocate memory for list */
if ((new_list = malloc(sizeof(struct list))) == NULL)
{
printf("\n enters here \n");
return 1;
}
/* Does item already exist? */
current_list = lookup_string(hashtable, str);
if (current_list == NULL)
{
printf("\n DEBUG Purpose \n");
printf("\n NULL \n");
}
/* item already exists, don't insert it again. */
if (current_list != NULL)
{
printf("\n Item already present...\n");
return 2;
}
/* Insert into list */
printf("\n Inserting...\n");
new_list->string = strdup(str);
new_list->next = NULL;
//new_list->next = hashtable->table[hashval];
if(hashtable->table[hashval] == NULL)
{
hashtable->table[hashval] = new_list;
}
else
{
struct list * temp_list = hashtable->table[hashval];
while(temp_list->next!=NULL)
temp_list = temp_list->next;
temp_list->next = new_list;
hashtable->table[hashval] = new_list;
}
return 0;
}
答案 0 :(得分:5)
我没有检查确认,但这行看起来不对:
hashtable->table[hashval] = new_list;
这是add_string
的最后一个案例的结尾。你有:
struct list
以保留要添加的值struct list
放在链接列表的末尾然后,按照上面引用的那一行,您告诉哈希表将新 struct list
放在链接列表的 head 处这个哈希值!因此丢掉之前存在的整个链表。
我认为你应该省略我上面引用的那一行,看看你是如何继续的。前面的行正确地将它附加到现有列表的末尾。
答案 1 :(得分:2)
声明hashtable->table[hashval] = new_list;
是罪魁祸首。你在链表的末尾引用new_list
(我认为更好的名字本来是new_node
)。但是,然后用new_list
覆盖此链接列表,{{1}}只是一个节点。只需删除此声明。
答案 2 :(得分:0)
正如其他人已经指出的那样,您使用temp_list
走到列表的末尾,向其添加new_list
,然后丢弃现有列表。
由于相同的值NULL
用于表示空桶和列表的末尾,因此将新项目放在列表的开头会更容易。
您还应该进行任何测试,否则会在创建新项目之前添加新项目,否则会泄漏内存。
我还有一个内部查找函数,它接受哈希值,否则你必须计算两次
int add_string(struct hash_table *hashtable, char *str)
{
unsigned int hashval = hash(hashtable, str);
/* item already exists, don't insert it again. */
if (lookup_hashed_string(hashtable, hashval, str))
return 2;
/* Attempt to allocate memory for list */
struct list *new_list = malloc(sizeof(struct list));
if (new_list == NULL)
return 1;
/* Insert into list */
new_list->string = strdup(str);
new_list->next = hashtable->table[hashval];
hashtable->table[hashval] = new_list;
return 0;
}
答案 3 :(得分:-1)
哈希函数必须是一个函数,它将您的数据输入并返回分隔的id(例如:0到HASH_MAX之间的整数)
然后,您必须将元素存储在Hash(data)
数组的hash_table
索引的列表中。如果数据具有相同的散列,则它将与先前数据存储在同一列表中。
struct your_type_list {
yourtype data;
yourtype *next_data;
};
struct your_type_list hash_table[HASH_MAX];