我不明白为什么atoi()
适用于每个条目,但第一个条目。我有以下代码来解析一个简单的.csv文件:
void ioReadSampleDataUsers(SocialNetwork *social, char *file) {
FILE *fp = fopen(file, "r");
if(!fp) {
perror("fopen");
exit(EXIT_FAILURE);
}
char line[BUFSIZ], *word, *buffer, name[30], address[35];
int ssn = 0, arg;
while(fgets(line, BUFSIZ, fp)) {
line[strlen(line) - 2] = '\0';
buffer = line;
arg = 1;
do {
word = strsep(&buffer, ";");
if(word) {
switch(arg) {
case 1:
printf("[%s] - (%d)\n", word, atoi(word));
ssn = atoi(word);
break;
case 2:
strcpy(name, word);
break;
case 3:
strcpy(address, word);
break;
}
arg++;
}
} while(word);
userInsert(social, name, address, ssn);
}
fclose(fp);
}
.csv示例文件是这样的:
900011000;Jon Yang;3761 N. 14th St
900011001;Eugene Huang;2243 W St.
900011002;Ruben Torres;5844 Linden Land
900011003;Christy Zhu;1825 Village Pl.
900011004;Elizabeth Johnson;7553 Harness Circle
但这是输出:
[900011000] - (0)
[900011001] - (900011001)
[900011002] - (900011002)
[900011003] - (900011003)
[900011004] - (900011004)
我做错了什么?
答案 0 :(得分:5)
我猜你的CSV文件是以UTF-8格式保存的,并且在开头有一个BOM(byte order mark),这让我感到困惑atoi
。您可以通过在十六进制编辑器中查看文件或查看word
的前几个字节来验证这一点。
UTF-8的BOM是三个字节,值为0xEF,0xBB,0xBF。
如果可能,请将文件另存为ASCII。如果没有,请添加代码以检测并跳过这些字节。
答案 1 :(得分:2)
我的猜测是文件以字节顺序标记开头。 atoi()
将其视为非数字,因此返回0.
if (line[0] == 0xEF && line[1] == 0xBB && line[2] == 0xBF) {
/* byte order mark is present, so skip it somehow */
}