通过使用strsep拆分来解析CSV文件

时间:2016-09-07 07:51:22

标签: c string csv parsing token

尝试使用strsep()解析逗号分隔值文件时,我收到了一些不需要的输出。它似乎适用于文件的一半,只有一个数字(即0-9),但只要添加了多个值,例如512,

将打印512 12 2 512 12 2,依此类推。我不确定这是否是由于我正在循环的特定风格?不太确定。

int main() {

        char line[1024];

        FILE *fp;

        int data[10][10];

        int i = 0;
        int j = 0;

        fp = fopen("file.csv", "r");

        while(fgets(line, 1024, fp)) {

                char* tmp = strdup(line);
                char* token;
                char* idx;

                while((token = strsep(&tmp, ","))) {

                        for (idx=token; *idx; idx++) {
                                data[i][j] = atoi(idx);
                                j++;
                        }
                }
                i++;
                j=0;

                free(tmp);

        }


         for(i = 0; i < 10; i++) {

                for(j = 0; j < 10; j++) {
                printf("%d ", data[i][j]);
                }
                printf("\n");
        }

        fclose(fp);
}

1 个答案:

答案 0 :(得分:3)

这是因为您通过使用strsep()返回的令牌中的每个字符作为循环开始来创建元素

for (idx=token; *idx; idx++) {
        data[i][j] = atoi(idx);
        j++;
}

停止这样做并从一个令牌中只创建一个元素来纠正:

while((token = strsep(&tmp, ","))) {

        data[i][j] = atoi(token);
        j++;
}

同样free(tmp);将不执行任何操作,因为tmpNULL设置为strsep()。要释放通过strdup()分配的缓冲区,请将指针保存在另一个变量中并将其用于释放。