使用C
中的sscanf从标准输入流中解析数字我有一个文本文件,其中包含以字母开头的行,然后是无符号整数(有时是一对,有时只有一行)。在每行的乞讨处是一个字母来对行进行分类。 (见下文)我能够获取文件的内容并将其读取到屏幕。但是,我正在努力使用sscanf来提取每行中的字母和每个整数。因此结果将是char,int和int都在单独的变量中 - 仅使用'a'行作为示例。我一直在使用下面的代码。我得到的最好的是sscanf导致给出全零的奇怪行为。同样,我正在尝试将char和每个int放入单独的变量中。
来自文本文件的行样本
a -1109180 699692587
a 1213834231 -226769626
c 994957275 2082945813
e 1213834231
//The Code Used//////////////
char *line = NULL;
size_t size;
int results;
int val1;
int val2;
while (getline(&line, &size, stdin) != -1){
if(strstr(line,"a") != NULL){
sscanf(line,"Val1 and Val2: %d %d", val1,val2);
printf("Value1 %d\n",val1);
printf("Value2 %d\n",val2);
}
//This prints each line in file
printf("%s\n", line);
}
有点不知道这里缺少什么。 sscanf是在C中实现这一目标的最佳方法还是有更简单的替代方案?提前致谢。
答案 0 :(得分:0)
值得庆幸的是,您可以使用面向行的输入函数fgets
或getline
,然后对sscanf
进行一次调用,以便处理所有情况。阅读完您的专辑后,您可以将其传递给类似以下内容的sscanf
来电:
rtn = sscanf (buf, "%c %d %d", &c, &v1, &v2); /* always check return */
保留返回(即根据格式字符串发生的成功转换次数),您可以开始回答有关您可以预期的数据的逻辑问题。但是,在盲目地比较是否有三次,两次或更少的转换之前,您只需查看缓冲区中的第一个字符即可回答简单问题。如果您需要一个小写字母来开始一个有效的行,那么您需要做的就是取消引用您的缓冲区以获取第一个字符,然后检查它是否在'a' - 'z'
之间。如果没有,它不是有效的行。同样,如果您检查第一个字符并找到它0
(终止字符)或'\n'
,那么您就知道该行是空的,您不必再费心了。这两个测试将过滤掉所有可能至少留下符合您标准的行的crud。例如,只需检查:
if (rtn == 0) { /* no successful conversions took place */
fprintf (stderr, "error: no values parsed from line.\n");
continue;
}
if (!*buf || *buf == '\n') { /* check if buf was empty line */
fprintf (stderr, "error: line is empty or contians only newline.\n");
continue;
}
if (*buf < 'a' || 'z' < *buf) { /* check first char not a-z */
fprintf (stderr, "error: no lowercase char beginning line.\n");
continue;
}
让您确信至少您操作的线路有合理的机会匹配您要查找的内容。
现在你可以做if ... else if .... else if ....
(这很好),或者因为你知道你主要关心检查值1-3
,所以switch
语句对于处理剩余的线。例如,您可以执行以下操作来解析那些需要查看的行的值:
switch (rtn) { /* switch on number of successful conversions */
case 3: /* three successful conversions */
printf ("all values: '%c' %d %d\n", c, v1, v2);
break;
case 2: /* two successful conversions */
printf ("two values: '%c' %d\n", c, v1);
break;
default: /* one or less (need at least two */
fprintf (stderr, "error: no character and value on line.\n");
}
将所有这些部分放在一起,你可以做类似的事情:
#include <stdio.h>
#define MAXC 256
int main (void) {
char buf[MAXC] = "";
while (fgets (buf, MAXC, stdin)) /* read each line into buf */
{
char c;
int v1, v2, rtn; /* vars for values and sscanf return */
rtn = sscanf (buf, "%c %d %d", &c, &v1, &v2);
if (rtn == 0) { /* no successful conversions took place */
fprintf (stderr, "error: no values parsed from line.\n");
continue;
}
if (!*buf || *buf == '\n') { /* check if buf was empty line */
fprintf (stderr, "error: line is empty or contians only newline.\n");
continue;
}
if (*buf < 'a' || 'z' < *buf) { /* check first char not a-z */
fprintf (stderr, "error: no lowercase char beginning line.\n");
continue;
}
switch (rtn) { /* switch on number of successful conversions */
case 3: /* three successful conversions */
printf ("all values: '%c' %d %d\n", c, v1, v2);
break;
case 2: /* two successful conversions */
printf ("two values: '%c' %d\n", c, v1);
break;
default: /* one or less (need at least two */
fprintf (stderr, "error: no character and value on line.\n");
}
}
return 0;
}
示例输入文件
$ cat dat/input.txt
a -1109180 699692587
a 1213834231 -226769626
c 994957275 2082945813
e 1213834231
有点杂乱的文件:
$ cat dat/rows.txt
a -1109180 699692587
a quick brown fox jumps over the lazy dog
a 1213834231 -226769626
c 994957275 2082945813
227 isn't good
e 1213834231
应该提供一个很好的测试,看看代码是否符合你的需要。通过代码运行数据提供:
示例使用/输出
$ /bin/sscanf_mixed <dat/input.txt
all values: 'a' -1109180 699692587
all values: 'a' 1213834231 -226769626
all values: 'c' 994957275 2082945813
two values: 'e' 1213834231
杂乱的文件输出:
$ ./bin/sscanf_mixed <dat/rows.txt
all values: 'a' -1109180 699692587
error: no character and value on line.
all values: 'a' 1213834231 -226769626
error: line is empty or contians only newline.
all values: 'c' 994957275 2082945813
error: no lowercase char beginning line.
two values: 'e' 1213834231
如您所见,两个输入文件提供了相同数量的转换,第二个只是注意到遇到不合格行时发生的错误或问题。
仔细看看,如果您有任何疑问,请告诉我。有很多方法可以解决问题的逻辑,但是你选择哪种方式,你想确保你构建所有输入例程足够灵活,以处理你应该合理期望的那些条件(空行等...)在现实世界中使用。