从C中的逗号分隔文本文件中读取各种长度的数据

时间:2014-03-21 21:54:37

标签: c file

我有一个txt文件,其中的单词和数字用逗号分隔。我想在下一个逗号之前读取字符,处理数据然后继续从找到最后一个逗号的位置读取。我使用fgetc(),我不确定它是否更新了FILE指针中的最后一个读取位置。

我遵循了这里提出的一般想法,这不起作用但接近。开头的状态检查似乎不能很好地工作(EOF)。似乎我在复制航空公司名称时会得到一个额外的字符,之后它会崩溃。

// Read data from file, data is comma delimited!
flight* read_from_text()
{
    #define DATA_CHUNK 20
    FILE *fp;
    flight temp_data;
    flight *data=malloc(sizeof(*data));
    data=&temp_data;
    char buffer[DATA_CHUNK];
    int c=0,n=0,i=0,state=0;

    // Open file for reading
    if((fp=fopen("c:\\data.txt","r"))==NULL)
    {
        printf("Error opening flight data file.");
        return NULL;
    }

    // read a single entry from file

    while(1)
    {
        while(((c=fgetc(fp))!=',')||(c=!EOF))
            buffer[n++]=(char)c;
        if(c==EOF) break;

        switch(state)
        {
            case CODE:
                // Check if flight code is valid
                if((buffer[0]<'0')||(buffer[0]>'9')||(buffer[1]<'0')||(buffer[1]>'9'))
                    printf("Error reading in flight number\n");
                else
                    temp_data.code=atoi(buffer);
                state++;
                break;
            case AIRLINE_NAME:
                // Check airline name length is OK
                if(n>(sizeof(temp_data.airline_name)))
                    printf("Airline name is too long, some characters will be cut\n");
                strncpy(temp_data.airline_name,buffer,n);
                state++;
                break;
            case DESTINATION:
                if(n>(sizeof(temp_data.destination)))
                    printf("Destination name is too long, some characters will be cut\n");
                strncpy(temp_data.destination,buffer,n);
                state++;
                break;
            case RESERVED_SEATS:
                temp_data.reserved_seats=atoi(buffer);
                state++;
                break;
            case DATE:
                if(n>(sizeof(temp_data.date)))
                    printf("Date format is too long, might be corrupted\n");
                strncpy(temp_data.date,buffer,n);
                state=0;
                break;
        }

        // Clear buffer
        for(i=0;i<DATA_CHUNK;i++)
            buffer[i]='\n';
        n=0;
    }

    printf("%d\n",temp_data.code);
    printf("%s\n",temp_data.airline_name);
    printf("%s\n",temp_data.destination);
    printf("%d\n",temp_data.reserved_seats);
    printf("%s\n",temp_data.date);
    getchar();

    return data;
}

2 个答案:

答案 0 :(得分:0)

您也可以考虑一次阅读并使用类似strtok的内容 使用&#39;来读取每个子字符串,&#39;作为分隔符。对于一个简单的程序,这应该是 好。 strtok具有内部状态,因此您无法将其与其他调用交错,因此它不是线程安全的。或者,您可以查看函数&#34; index&#34;在strings.h中。它返回一个指向第一次出现的字符的指针,如&#39;,&#39;。

在任何情况下,您都可以使用fgetc构建一个简单的状态机并回答您的问题,每次后续调用都将获得文件中的下一个字符。

答案 1 :(得分:0)

是的,函数fgetc更新Read指针,直到它返回EOF,表示文件结束。

由于这个EOF,函数fgetc会返回int而不是char

因此,在存储函数fgetc的返回值时,请使用int而不是char

如果是EOF,那么您就知道自己已到达文件的末尾。

否则,将其投射到char并按“计划”继续进行。

例如:

FILE* fp = fopen(fileName,"r");
int i;
char c;
while (1)
{
    i = fgetc(fp);
    if (i == EOF)
        break;
    c = (char)i;
    ...
}
fclose(fp);