在C中寻找一个好的哈希表实现

时间:2009-07-16 16:22:34

标签: c string hashtable hash

我主要对字符串键感兴趣。有人能指点我去图书馆吗?

14 个答案:

答案 0 :(得分:56)

我有同样的需求并做了一些研究,最后使用libcfu

它简单易读,如果我需要修改,我可以不花太多时间去理解。它也是BSD许可证。无需更改我的结构(嵌入说下一个指针)

由于以下原因(我个人原因,YMMV),我不得不拒绝其他选项:

  • sglib - >它是一个宏迷宫,我不习惯调试/制作 仅使用宏来改变这样的代码库
  • cbfalconer - >许多许可红旗,网站关闭和网上关于支持/作者的太多不利讨论;不想承担风险
  • google sparce-hash - >如前所述,它适用于C ++,而不是C
  • glib(gnome hash) - >看起来很有希望;但我找不到任何简单的方法来安装开发人员工具包;我只需要C例程/文件 - 而不是完整的开发环境
  • 朱迪 - >对于简单的使用来说似乎太复杂了..如果我不得不遇到任何问题,也没准备好调试自己
  • npsml(此处提及) - >找不到来源
  • strmap发现非常简单和有用 - 它太简单了,键和值都必须是字符串;值是字符串似乎限制太多(应该接受void *)
  • uthash - >似乎很好(已在维基百科上提到哈希表);发现它需要修改结构 - 不想这样做,因为性能并不是我使用的真正问题 - 更多的是开发速度。

总结一下,非常简单的使用strmap是好的; uthash如果您担心额外的内存使用。如果只是开发速度或易用性是主要目标,libcfu获胜[注意libcfu内部进行内存分配以维护节点/哈希表]。令人惊讶的是,没有很多简单的C哈希实现可用。

答案 1 :(得分:16)

GLib是一个很棒的库,可以作为C项目的基础。他们有一些不错的数据结构产品,包括哈希表:http://developer.gnome.org/glib/2.28/glib-Hash-Tables.html(链接已更新4/6/2011)

答案 2 :(得分:8)

对于字符串,Judy Array可能是好的。

  

Judy数组是一种复杂但非常快速的关联数组数据结构,用于使用整数或字符串键存储和查找值。与普通数组不同,Judy数组可能稀疏;也就是说,他们可能有大量未指定的指数。

这是Judy library in C

  

C库,提供实现稀疏动态数组的最先进核心技术。 Judy数组只用空指针声明。 Judy数组仅在填充时消耗内存,但如果需要,可以增长以利用所有可用内存。


其他参考文献,
Wikipedia hash implementation reference有一些 C 开源链接 此外,cmph - C中的最小完美哈希库,支持多种算法。

答案 3 :(得分:5)

答案 4 :(得分:5)

Dave Hanson的C Interfaces and Implementations包括一个精细的哈希表和其他几个精心设计的数据结构。还有一个很好的字符串处理接口。如果你能负担得起,这本书很棒,但即便没有,我发现这个软件设计得很好,小到可以完全学习,并且很容易在几个不同的项目中重复使用。

答案 5 :(得分:5)

自从我提出这个问题以来已经很久了...我现在可以将自己的公共域库添加到列表中:

http://sourceforge.net/projects/npsml/

答案 6 :(得分:4)

C Interfaces and Implementations讨论了C中的哈希表实现。源代码是available online。 (我的这本书的副本正在起作用,所以我不能更具体。)

答案 7 :(得分:3)

Apache的APR库有自己的hash-implementation。它已经被移植到Apache运行的任何东西上,Apache license也相当自由。

答案 8 :(得分:3)

来自samtools / bwa / seqtk / klib的khash.h

curl https://raw.github.com/attractivechaos/klib/master/khash.h

通过http://www.biostars.org/p/10353/

答案 9 :(得分:2)

从未使用它,但Google Sparsehash可能有效

答案 10 :(得分:1)

下载tcl并使用经过时间验证的tcl哈希函数。这很简单。 TCL API已有详细记录。

答案 11 :(得分:0)

答案 12 :(得分:-1)

http://www.cl.cam.ac.uk/~cwc22/hashtable/

定义的功能

* create_hashtable
* hashtable_insert
* hashtable_search
* hashtable_remove
* hashtable_count
* hashtable_destroy

使用示例

  struct hashtable  *h;
  struct some_key   *k;
  struct some_value *v;

  static unsigned int         hash_from_key_fn( void *k );
  static int                  keys_equal_fn ( void *key1, void *key2 );

  h = create_hashtable(16, hash_from_key_fn, keys_equal_fn);

  insert_key   = (struct some_key *) malloc(sizeof(struct some_key));
  retrieve_key = (struct some_key *) malloc(sizeof(struct some_key));

  v = (struct some_value *) malloc(sizeof(struct some_value));

  (You should initialise insert_key, retrieve_key and v here)

  if (! hashtable_insert(h,insert_key,v) )
  {     exit(-1);               }

  if (NULL == (found = hashtable_search(h,retrieve_key) ))
  {    printf("not found!");                  }

  if (NULL == (found = hashtable_remove(h,retrieve_key) ))
  {    printf("Not found\n");                 }

  hashtable_destroy(h,1); /* second arg indicates "free(value)" */

答案 13 :(得分:-1)

stl有map和hash_map(hash_map仅在某些实现中),如果你能够使用C ++,它们是值的关键。

http://www.cplusplus.com/reference/stl/map/