我有一个具有以下结构的文件:
finance
www.lemonde.fr 4
|
Brexit:
www.lemonde.fr 2
|
divorce
www.lemonde.fr 2
www.lequipe.fr 8
|
amiable
www.lemonde.fr 2
|
rupture
www.lemonde.fr 2
www.leparisien.com 3
www.lequipe.fr 2
|
Economie
www.lemonde.fr 1
|
Entreprises
www.lemonde.fr 2
www.laposte.fr/particulier 1
|
xiti
www.laposte.fr/particulier 1
|
实际上文件要大得多,这些是最后一行。
我的目标是将此文件加载到哈希表中。 关键是每个块的第一个字。 该值将是指向此结构的指针:
typedef struct wordInfo {
char **urls_list;
int *nbOccurence;
int size;
} wordInfo;
主要功能:
int main(){
GHashTable *hash = loadIndex("index.txt");
printf("Nombre de clé dans la table: %d\n", g_hash_table_size(hash));
g_hash_table_foreach(hash, (GHFunc)iterator, "Cle: %s, Value: %p\n");
wordInfo* x = g_hash_table_lookup(hash, "xiti");
if(x == NULL){
printf("NULL\n");
}
printf("Taille: %d",x->size);
for(int i = 0 ; i < x->size ; i++){
printf("Lien: %s\n", (x->urls_list)[i]);
}
g_hash_table_destroy(hash);
return 0;
}
加载文件的函数loadIndex():
GHashTable* loadIndex(char *filename){
FILE *f=fopen(filename,"r");
GHashTable* hash = g_hash_table_new(g_str_hash, g_str_equal);
char *word=malloc(100);
while(fgets(word,100,f)!=NULL) { // reading a word
char *aux=strchr(word,'\n'); // removes the trailing \n
aux[0]='\0';
// we make a structure for the wod we just found
wordInfo *x = g_malloc(sizeof(wordInfo));
x->urls_list = malloc(sizeof(char)*100);
x->size = 0;
x->nbOccurence = malloc(sizeof(int)*100);
char *line = malloc(100);
while(fgets(line,100,f)!=NULL){ //read urls for the found word
if(!strcmp(line,"|\n")){ // until we find character |
break;
}
char *url = strtok(line," ");
char *occ = strtok(NULL," ");
x->urls_list[x->size] = malloc(strlen(url));
strcat(x->urls_list[x->size],url);
x->nbOccurence[x->size] = atoi(occ);
x->size += 1;
}
char* key;
key = g_strdup(word);
g_hash_table_insert(hash, key ,(wordInfo*)x);
}
return hash;
}
foreach输出是:
Cle: xiti, Value: 0x978b40
Cle: xiti, Value: 0x687e60
Cle: xiti, Value: 0xb23830
Cle: xiti, Value: 0x86b1f0
Cle: xiti, Value: 0x81e890
Cle: xiti, Value: 0x9df7c0
Cle: xiti, Value: 0x6b0330
Cle: xiti, Value: 0x9eef10
正如你所看到的,我没有不同的单词作为键,只有文件中的最后一个单词。我也不明白我怎么能多次使用相同的键,是不是假设包含唯一键钥匙?
答案 0 :(得分:0)
我找到了解决方案:我必须使用g_strdup来创建密钥,添加char *作为密钥不起作用。我编辑了代码