我发现了这个简单的实现:
http://www.onextrabit.com/view/502c152965e7d250c5000001
然而,它没有任何共谋避免。所以我修改了它:
#include <iostream>
#include <sstream>
using namespace std;
template <typename ElemType>
class HashTable {
private:
// data
ElemType* hashData;
// hash table size
int tableSize;
// djb2 hash function
int hashing(string key) {
int hash = 5381;
for (int i = 0; i < key.length(); i++)
hash = ((hash << 5) + hash) + (int)key[i];
return hash % tableSize;
}
public:
HashTable(int size) {
tableSize = size;
// init hash table data given table size
hashData = new ElemType[tableSize];
}
~HashTable() {
delete[] hashData;
}
void set(string key, const ElemType& value) {
int index = hashing(key);
int i = 0;
for (;(hashData[index] != (ElemType)NULL) && (i <= tableSize); i++) {
index = (index + 1) % tableSize;
}
if (i > tableSize) {
cout << "No empty bucket!" << endl;
return ;
}
hashData[index] = value;
}
string get(string key) {
int index = hashing(key);
stringstream result;
result << hashData[index];
int i = 0;
for (;(hashData[++index] != (ElemType)NULL) && (i <= tableSize); i++) {
result << " or " << hashData[index];
index %= tableSize;
}
return result.str();
}
};
int main() {
HashTable<int> hash(50);
hash.set("Hello", 12);
hash.set("World", 22);
hash.set("Wofh", 25);
for (int i = 1; i < 10; i++) {
hash.set("Wofh", i);
}
cout << "Hello " << hash.get("Hello") << endl;
cout << "World " << hash.get("World") << endl;
cout << "Wofh " << hash.get("Wofh") << endl;
return 0;
}
这是我第一次实现哈希表。现在“世界”和“Wofh”从hashing()
函数获得相同的结果。显然这引起了勾结。但是,当我想要检索“世界”时,它会显示所有相互关联的值。我的问题是,有没有办法只使用线性探测显示“世界”数字(即22)?
答案 0 :(得分:1)
每个表条目都需要包含与哈希匹配的键/值对集合。然后,您需要在查找表条目后搜索所请求密钥的集合。
如果碰撞很少,那么简单的对矢量可能就足够了。如果它们足够频繁以至于搜索速度太慢,并且您无法通过放大表或使用更好的has函数来降低频率,那么请考虑对向量进行排序并使用二进制搜索或使用std::map
,或另一个哈希表(具有不同的哈希函数),用于存储冲突元素。
当然,除非这是一个学习练习,否则通常只使用std::unordered_map
(如果不能使用C ++ 11库,则使用Boost,TR1或STL等效项。)
此外,在设计管理内存或其他资源的类时,请始终记住Rule of Three。如果有人试图复制它,你的课将会出现严重错误。