C:在文件中查找重复的字符串值

时间:2015-04-23 21:39:40

标签: c string file qsort

所以我有一个包含let的文件:

cat
dog
cat

我正在尝试浏览该文件,让它识别出有两个cat元素和一个dog元素,然后在同一个文件中编辑为:

cat - 2
dog - 1

我已经将所有单词保存在字符串数组char **wordList中,并且我尝试使用qsort对它们进行排序,然后将其置于上述格式中。我的qsort功能是:

stringcmp(const void *a, const void *b)
 {
     const char **ia = (const char **)a;
     const char **ib = (const char **)b;
     return strcmp(*ia, *ib);
 }

 void wordSort(char **wordlist)
 {
     size_t strings_len = numwords - 1;
     qsort(wordlist, strings_len, sizeof(char*), stringcmp);
     wordFile(wordlist);
 }

void wordFile(char **wordlist)
 {
     if((outFilePtr2 = fopen(outWords, "w")) != NULL)
     {
         for(x = 1; x < numwords; x++)
         {
             fputs(wordlist[x], outFilePtr2);
             fputs("\n", outFilePtr2);
         }
         fclose(outFilePtr2);
     }
     else
     {
         printf("File\"%s\" could not be opened.\n", outWords);
     }
 }

虽然没有按顺序排序。我该如何解决?

1 个答案:

答案 0 :(得分:2)

以下程序适用于您对stringcmp的定义(看起来是正确的):

int main (int argc, char *argv[]) {
    int i;
    qsort(argv, argc, sizeof(char *), &stringcmp);
    for (i = 0; i != argc; i++) printf("%s\n", argv[i]);
}

因此,我怀疑您对char **wordList的定义有疑问。

<强>更新

此版本稍微修改/完成的程序版本适用于我:

#include <stdio.h>
#include <string.h>
#include <stdlib.h>

char *outWords = "outWords.txt";
char *wordList[] = { "cat", "dog", "cat" };
#define numwords (sizeof(wordList) / sizeof(wordList[0]))
FILE *outFilePtr2;
int x;

int stringcmp(const void *a, const void *b)
 {
     const char **ia = (const char **)a;
     const char **ib = (const char **)b;
     return strcmp(*ia, *ib);
 }       

 void wordSort(char **wordlist)
 {       
     qsort(wordlist, numwords, sizeof(char*), stringcmp);
     wordFile(wordlist);
 }   

void wordFile(char **wordlist)
 {   
     if((outFilePtr2 = fopen(outWords, "w")) != NULL)
     {
         for(x = 0; x < numwords; x++)
         { 
             fputs(wordlist[x], outFilePtr2);
             fputs("\n", outFilePtr2);
         }
         fclose(outFilePtr2);
     }
     else
     {
         printf("File\"%s\" could not be opened.\n", outWords);
     }
 }

int main() {
    wordSort(wordList);
    wordFile(wordList); 
    return 0;
}

我调整了qsort的第二个参数(否则最后一个字符串指针将不被考虑,并保持不变)。我还调整了x=0for - 循环的初始化wordFile,以便打印第一个字符串。

您可能以某种其他方式定义了** wordList导致问题,但您没有为其提供代码。