读取文本文件,将每一行分成单独的数组并在C中排序

时间:2016-04-14 21:58:24

标签: c arrays sorting c-strings

我正在尝试编写一个读取文本文件的程序,并将每一行分成不同的数组,以便按日期和名称对它们进行排序。我仍然无法通过'按日期排序'功能正常工作/显示,这就是为什么我还没有尝试按名称功能排序。

我似乎能够在日期中扫描并命名数组,但我认为我需要修改我在最后一个数组“日期”中扫描的方式,因为我需要在逗号后用空格分隔它们。问题是我不知道如何将它们作为字符串扫描,因为它们之间会有空格,而某些名称具有不同的状态数。 (此时我删除了文本文件中状态之间的空格,但是文本文件可能需要将它们放回去?)

我的代码到目前为止......

#include <stdio.h>
#include <string.h>

#define MAX 30

void sortByDate( int year[], char *name[], char *states[], int count);
void sortByName(int year[], char name[], char states[], int count);

int main()
{
     int year[MAX]; 
     int i, a;
     int count = 0;
     int choice;
     char *name[MAX],
          *states[MAX];
     char b[MAX], c[MAX];

     FILE *inp = fopen("hurricanes.txt","r");               /* defining file input    */

     for(i=0;i<MAX;i++)
     {
         if( feof(inp) )
        {
            break;
        } 
        fscanf(inp, "%d", &a);
        fscanf(inp, "%s", &b);
        fscanf(inp, "%s", &c);
        year[i]=a;
        strcpy(&name[i],b);
        strcpy(&states[i],c);
        ++count; 

        printf("%d %s %s\n", year[i], &name[i], &states[i]);
     }

     printf("Press 0 to sort by date or 1 to sort by name: ");
     scanf("%d", &choice);  
     if (choice == 0)
     {
         sortByDate(year, name, states, count); 
     }
     else if ( choice == 1)
     {
          //sortByName(year, name, states, count); 
     }

     getch();
     return 0;
}

void sortByDate( int year[], char *name[], char *states[], int count )
{
     int d = 0;
     int c = 0;

     int yearTmp;
     char nameTmp[MAX], statesTmp[MAX];
     int order[count];
     int tmp = 0;

     FILE *outp = fopen("report.txt","w");                 /* defining file output   */

     for (c = 0; c < count; ++c)
     {
         order[c] = c; 
     } 

     for (c = 0 ; c < ( count - 1 ); c++)
     {
          for (d = 0 ; d < count - c - 1; d++)
          {
               if (year[d] > year[d+1])
               {
                    yearTmp = year[d];
                    year[d] = year[d+1]; 
                    year[d+1] = yearTmp; 

                    tmp = order[d];
                    order[d] = order[d+1];
                    order[d+1] = tmp;   
              }
          }
     }

     for (c = 0; c < count; ++c)
     {
          printf("%d %-10s %s\n",  year[c], &name[order[c]], &states[order[c]]); 
     } 
}

//void sortByName(int year[], char name[], char states[], int count)
//{
//} 

hurricanes.txt文件....(同样,我删除了状态之间的空格,但我认为它们需要重新放入并进行不同的扫描?)

1960 Donna FL,NC
1969 Camille MS
1972 Agnes FL
1983 Alicia TX
1989 Hugo SC,NC
2005 Katrina FL,LA,MS
2005 Rita TX,LA
2005 Wilma FL
2008 Ike TX
2009 Ida MS
2011 Irene NC,NJ,MA,VT
2012 Isaac LA
1992 Andrew FL,LA
1995 Opal FL,AL
1999 Floyd NC
2003 Isabel NC,VA
2004 Charley FL,SC,NC
2004 Frances FL
2004 Ivan AL
2004 Jeanne FL

好的,所以我从这里发布的建议做了一些修改,结果很棒!

2 个答案:

答案 0 :(得分:3)

不是将值存储在单独的数组中,而是可能有更好的方法。只要您遇到包含多个相关值的数据排序,您就应该考虑struct。这就是C中的一种机制,它提供了一种在多个变量组成的数据之间关联排序的方法。

例如,在您的情况下,您有(1)year,(2)飓风name,以及(3)飓风path通过所有代表单一的州事件。当您拥有要由yearnamepath排序的多个事件组成的数据时,您需要一种方法来保留哪个名称出现在哪一年与之间的相关性什么路。一个简单的结构如下所示

typedef struct {
    unsigned year;
    char name[MAXC];
    char path[MAXC];
} hcdata;

在您的程序中,您可以声明 类型hcdata的数组,并使用从文件中读取的数据填充数组。虽然您通常希望使用面向行的输入函数(fgetsgetline)一次读取一行,但是当您具有完全相同的信息格式时每一行,scanf系列函数都可以提供一个现实的替代方案。 (这是有限时间之一scanffgets等的现实替代品。)

要使fscanf正常工作,您应该考虑正在阅读的行中的每个字符(包括'\n')。虽然读取整数值会跳过干预空格,但如果你养成了对每个字符进行计算的习惯,那么当你的下一行以字符开头时,你不会感到惊讶。在这种情况下,您可以使用格式字符串:

    char *fmt = "%u %31[^ ] %31[^\n]%*c";

最后,qsort是对C库中的数据进行排序的默认标准方法。它通过几种不同的排序方法进行了优化,这些方法针对大/小数据集进行了优化,这些数据集协同工作以产生快速快速排序。您需要做的就是编写比较函数以传递给qsort。使用上面的结构,要对nameyear进行排序, compare 函数几乎是微不足道的。例如,

int cmpname (const void *a, const void *b)
{   return strcmp (((hcdata *)a)->name, ((hcdata *)b)->name); }

int cmpyear (const void *a, const void *b)
{   return ((hcdata *)a)->year - ((hcdata *)b)->year; }

您可以根据需要使用简单的排序函数,或者您可以定制排序以在主值之间没有差异的情况下对辅助参数进行排序。例如,如果name相同,则按year按字母顺序排序:

int cmpyear (const void *a, const void *b)
{   
    int diff = ((hcdata *)a)->year - ((hcdata *)b)->year;

    if (diff > 0)   /* if years differ, sort by year */
        return 1;
    else if (diff < 0)
        return -1;

    /* otherwise sort alphabetically with same year */
    return strcmp (((hcdata *)a)->name, ((hcdata *)b)->name);
}
然后

排序变得像单个呼叫一样简单,例如:

    qsort (hcd, idx, sizeof *hcd, cmpname);

将所有部分放在一起,您可以阅读您的数据,按name排序,然后按year再次排序:

#include <stdio.h>
#include <stdlib.h>
#include <string.h>

enum { MAXC = 32, MAXL = 128 };

typedef struct {
    unsigned year;
    char name[MAXC];
    char path[MAXC];
} hcdata;

int cmpname (const void *a, const void *b);
int cmpyear (const void *a, const void *b);
void prndata (hcdata *h, size_t n);

int main (int argc, char **argv) {

    hcdata hcd[MAXL] = {{ 0, {""}, {""} }};
    size_t idx = 0;
    char *fmt = "%u %31[^ ] %31[^\n]%*c";
    FILE *fp = argc > 1 ? fopen (argv[1], "r") : stdin;

    if (!fp) {  /* validate file open for reading */
        fprintf (stderr, "error: file open failed '%s'.\n", argv[1]);
        return 1;
    }

    /* read each line of data into an array of struct */
    while (idx < MAXL && fscanf (fp, fmt,
        &hcd[idx].year, hcd[idx].name, hcd[idx].path) == 3)
        idx++;

    printf ("\noriginal file order:\n\n");
    prndata (hcd, idx);

    qsort (hcd, idx, sizeof *hcd, cmpname);    /* sort by name */
    printf ("\nsorted by hurricane name:\n\n");
    prndata (hcd, idx);

    qsort (hcd, idx, sizeof *hcd, cmpyear);    /* sort by year */
    printf ("\nsorted by year:\n\n");
    prndata (hcd, idx);

    if (fp != stdin) fclose (fp);

    return 0;
}

int cmpname (const void *a, const void *b)
{   return strcmp (((hcdata *)a)->name, ((hcdata *)b)->name); }

int cmpyear (const void *a, const void *b)
{   return ((hcdata *)a)->year - ((hcdata *)b)->year; }

void prndata (hcdata *h, size_t n)
{
    if (!h || !n) return;
    size_t i;
    for (i = 0; i < n; i++)
        printf (" y: %u    n: %-10s    p: %s\n", h[i].year,
                h[i].name, h[i].path);
}

示例使用/输出

$ ./bin/hurricanes <dat/hurricanes.txt

original file order:

 y: 1960    n: Donna         p: FL,NC
 y: 1969    n: Camille       p: MS
 y: 1972    n: Agnes         p: FL
 y: 1983    n: Alicia        p: TX
 y: 1989    n: Hugo          p: SC,NC
 y: 2005    n: Katrina       p: FL,LA,MS
 y: 2005    n: Rita          p: TX,LA
 y: 2005    n: Wilma         p: FL
 y: 2008    n: Ike           p: TX
 y: 2009    n: Ida           p: MS
 y: 2011    n: Irene         p: NC,NJ,MA,VT
 y: 2012    n: Isaac         p: LA
 y: 1992    n: Andrew        p: FL,LA
 y: 1995    n: Opal          p: FL,AL
 y: 1999    n: Floyd         p: NC
 y: 2003    n: Isabel        p: NC,VA
 y: 2004    n: Charley       p: FL,SC,NC
 y: 2004    n: Frances       p: FL
 y: 2004    n: Ivan          p: AL
 y: 2004    n: Jeanne        p: FL

sorted by hurricane name:

 y: 1972    n: Agnes         p: FL
 y: 1983    n: Alicia        p: TX
 y: 1992    n: Andrew        p: FL,LA
 y: 1969    n: Camille       p: MS
 y: 2004    n: Charley       p: FL,SC,NC
 y: 1960    n: Donna         p: FL,NC
 y: 1999    n: Floyd         p: NC
 y: 2004    n: Frances       p: FL
 y: 1989    n: Hugo          p: SC,NC
 y: 2009    n: Ida           p: MS
 y: 2008    n: Ike           p: TX
 y: 2011    n: Irene         p: NC,NJ,MA,VT
 y: 2012    n: Isaac         p: LA
 y: 2003    n: Isabel        p: NC,VA
 y: 2004    n: Ivan          p: AL
 y: 2004    n: Jeanne        p: FL
 y: 2005    n: Katrina       p: FL,LA,MS
 y: 1995    n: Opal          p: FL,AL
 y: 2005    n: Rita          p: TX,LA
 y: 2005    n: Wilma         p: FL

sorted by year:

 y: 1960    n: Donna         p: FL,NC
 y: 1969    n: Camille       p: MS
 y: 1972    n: Agnes         p: FL
 y: 1983    n: Alicia        p: TX
 y: 1989    n: Hugo          p: SC,NC
 y: 1992    n: Andrew        p: FL,LA
 y: 1995    n: Opal          p: FL,AL
 y: 1999    n: Floyd         p: NC
 y: 2003    n: Isabel        p: NC,VA
 y: 2004    n: Charley       p: FL,SC,NC
 y: 2004    n: Frances       p: FL
 y: 2004    n: Ivan          p: AL
 y: 2004    n: Jeanne        p: FL
 y: 2005    n: Katrina       p: FL,LA,MS
 y: 2005    n: Rita          p: TX,LA
 y: 2005    n: Wilma         p: FL
 y: 2008    n: Ike           p: TX
 y: 2009    n: Ida           p: MS
 y: 2011    n: Irene         p: NC,NJ,MA,VT
 y: 2012    n: Isaac         p: LA

将此处的实现与您在单个数组中的存储方法以及排序例程进行比较。虽然上面的代码依赖于静态声明的结构数组,但如果您面临读取未知数字,则没有理由无法动态地将结构动态声明为动态需要。如果您还有其他问题,请与我们联系。

答案 1 :(得分:1)

如果你的EOL字符是\n,你可以使用它:

fscanf(inp, "%d %s %29[^\n]", &a, b, c);

其中29是MAX - 1.将\n替换为您的EOL字符。

请注意,您不需要将&b, &c传递给fscanf,因为您的编译器会将b和c转换为&b[0]&c[0]。 此外,在printf上,当您的编译器期望&name[i]时,您正在传递char **,这是char *。您需要将&name[i]更改为name[i]&states[i]也一样。