uthash:2级哈希表,在嵌套表中添加新元素

时间:2017-06-15 16:06:04

标签: c hashtable uthash

我有一个2级哈希表,如here(uthash)所述,有两个不同的结构,如下所述。散列结构b通过散列结构a中的参数d保存s值及其频率的总数(为了更好地了解下面的设计)。

更新函数应该像这样工作:如果第一次遇到s,将它添加到struct myb并在struct mya中添加。如果它已经在struct myb中,那么检查它是否第一次遇到d值,以防将它添加到struct mya,否则增加它的值。

然而,当我运行代码时,它会在哈希结构mya中保存第一个遇到的d值(并在案例中增加)但是我没有添加在同一个s值上收到的其他d值...代码中有什么问题?

   d1:3           d2:5    
  /              / 
 s1 - d2:4     s2 - d4:3
  \             \
   d3:1          d5:2

---------------------------
#include <stdio.h> 
#include <string.h>
#include "uthash.h"


struct a{ 
   int x;
   int count;
   UT_hash_handle hh;
};

struct b{ 
   char s[24];
   int total;
   struct a *mya;
   UT_hash_handle hh;
};


void update(struct b **myb, const char *s, u_int32_t d){
  struct b *pb;

  HASH_FIND_STR(*myb, s, pb);
  if(pb == NULL) {
    pb = (struct b*)malloc(sizeof(struct b));
    if(!pb) return;

    strncpy(pb->s, s, sizeof(pb->s));
    pb->total = 1;
    pb->mya = NULL;
    HASH_ADD_STR(*myb, s, pb);


    struct a *pa = (struct a*)malloc(sizeof(struct a));
    if(!pa) return;

    pa->x = d;
    pa->count = 1;
    HASH_ADD_INT(pb->mya, x, pa);
  }
  else{
    struct a *pp=NULL;
    pb->total++;

    HASH_FIND_INT(pb->mya, &d, pp);
    if(pp == NULL){
      pp = (struct a*)malloc(sizeof(struct a));
      if(!pp) return;

      pp->count = 1;
      HASH_ADD_INT(pb->mya, x, pp);
    }
    else pp->count++; 
  }
}


void printAll(struct b *myb){
  struct b *pb, *tmp;
  struct a *pa, *tmp2;
  int i = 0, j = 0;

  HASH_ITER(hh, myb, pb, tmp) {
    i++;
    printf("%d) %s: %u\n", i, pb->s, pb->total);

    HASH_ITER(hh, pb->mya, pa, tmp2) {
      j++;
      printf("\t%d) %u: %u\n", j, pa->x, pa->count);
    }
    j = 0;
  }
}



struct b *myb = NULL;

int main(int argc, char **argv ){

  char str[10][24] = {"abc","abc","def","abc","hij","def","hij","def","abc","hij"};
  int values[10] =    {10,    10,   9,    8,    5,    2,    6,    2,    5,    5};
  int i;

  for(i=0; i<10; i++)
    update(&myb,str[i],values[i]);

  printf("hash table\n");
  printAll(myb);


  return 0;

}

1 个答案:

答案 0 :(得分:0)

比较update()函数的(大多数)工作版本的两个分支。看看在每种情况下如何初始化新的struct a。如果您还没有看到它,那么请记住会员存储您观察到的未记录的值。

这是正确的:当您向已存在的struct a添加新的struct b时,您无法设置其x成员。这完全解释了这个问题。

对于它的价值,我会分析用于创建和初始化新struct a的代码,以便您可以消除当前的重复。作为一个额外的优势,如果问题出现在具有分配和初始化struct a的特定目的的函数中,那么它可能更容易识别。