从文件中读取,atoi()仅在第一个元素上返回零

时间:2010-04-07 16:40:52

标签: c file-io csv atoi

我不明白为什么atoi()适用于每个条目,但第一个条目。我有以下代码来解析一个简单的.csv文件:

void ioReadSampleDataUsers(SocialNetwork *social, char *file) {
    FILE *fp = fopen(file, "r");

    if(!fp) {
        perror("fopen");
        exit(EXIT_FAILURE);
    }

    char line[BUFSIZ], *word, *buffer, name[30], address[35];
    int ssn = 0, arg;

    while(fgets(line, BUFSIZ, fp)) {
        line[strlen(line) - 2] = '\0';

        buffer = line;
        arg = 1;

        do {
            word = strsep(&buffer, ";");

            if(word) {
                switch(arg) {
                    case 1:
                        printf("[%s] - (%d)\n", word, atoi(word));
                        ssn = atoi(word);
                        break;
                    case 2:
                        strcpy(name, word);
                        break;
                    case 3:
                        strcpy(address, word);
                        break;
                }

                arg++;
            }
        } while(word);

        userInsert(social, name, address, ssn);
    }

    fclose(fp);
}

.csv示例文件是这样的:

900011000;Jon Yang;3761 N. 14th St
900011001;Eugene Huang;2243 W St.
900011002;Ruben Torres;5844 Linden Land
900011003;Christy Zhu;1825 Village Pl.
900011004;Elizabeth Johnson;7553 Harness Circle

但这是输出:

[900011000] - (0)
[900011001] - (900011001)
[900011002] - (900011002)
[900011003] - (900011003)
[900011004] - (900011004)

我做错了什么?

2 个答案:

答案 0 :(得分:5)

我猜你的CSV文件是以UTF-8格式保存的,并且在开头有一个BOM(byte order mark),这让我感到困惑atoi。您可以通过在十六进制编辑器中查看文件或查看word的前几个字节来验证这一点。

UTF-8的BOM是三个字节,值为0xEF,0xBB,0xBF。

如果可能,请将文件另存为ASCII。如果没有,请添加代码以检测并跳过这些字节。

答案 1 :(得分:2)

我的猜测是文件以字节顺序标记开头。 atoi()将其视为非数字,因此返回0.

if (line[0] == 0xEF && line[1] == 0xBB && line[2] == 0xBF) {
    /* byte order mark is present, so skip it somehow */
}