使用C中的sscanf从标准输入流中解析数字

时间:2017-03-29 04:19:00

标签: c parsing scanf

使用C

中的sscanf从标准输入流中解析数字

我有一个文本文件,其中包含以字母开头的行,然后是无符号整数(有时是一对,有时只有一行)。在每行的乞讨处是一个字母来对行进行分类。 (见下文)我能够获取文件的内容并将其读取到屏幕。但是,我正在努力使用sscanf来提取每行中的字母和每个整数。因此结果将是char,int和int都在单独的变量中 - 仅使用'a'行作为示例。我一直在使用下面的代码。我得到的最好的是sscanf导致给出全零的奇怪行为。同样,我正在尝试将char和每个int放入单独的变量中。

来自文本文件的行样本

a -1109180 699692587
a 1213834231 -226769626
c 994957275 2082945813
e 1213834231


//The Code Used//////////////

char *line = NULL;
size_t size;
int results;

int val1;
int val2; 

while (getline(&line, &size, stdin) != -1){

    if(strstr(line,"a") != NULL){

        sscanf(line,"Val1 and Val2: %d %d", val1,val2);
        printf("Value1 %d\n",val1);
        printf("Value2 %d\n",val2);

    }

//This prints each line in file 
printf("%s\n", line);

}

有点不知道这里缺少什么。 sscanf是在C中实现这一目标的最佳方法还是有更简单的替代方案?提前致谢。

1 个答案:

答案 0 :(得分:0)

Ethan,有时候你需要放慢速度以帮助C落地。我的情况下你的数据显然会在每行的开始行中包含一个分类字符。这可以跟随您需要阅读和处理的一个或两个数字。您的问题由数据集定义。

值得庆幸的是,您可以使用面向行的输入函数fgetsgetline,然后对sscanf进行一次调用,以便处理所有情况。阅读完您的专辑后,您可以将其传递给类似以下内容的sscanf来电:

rtn = sscanf (buf, "%c %d %d", &c, &v1, &v2);  /* always check return */

保留返回(即根据格式字符串发生的成功转换次数),您可以开始回答有关您可以预期的数据的逻辑问题。但是,在盲目地比较是否有三次,两次或更少的转换之前,您只需查看缓冲区中的第一个字符即可回答简单问题。如果您需要一个小写字母来开始一个有效的行,那么您需要做的就是取消引用您的缓冲区以获取第一个字符,然后检查它是否在'a' - 'z'之间。如果没有,它不是有效的行。同样,如果您检查第一个字符并找到它0(终止字符)或'\n',那么您就知道该行是空的,您不必再费心了。这两个测试将过滤掉所有可能至少留下符合您标准的行的crud。例如,只需检查:

    if (rtn == 0) { /* no successful conversions took place */
        fprintf (stderr, "error: no values parsed from line.\n");
        continue;
    }

    if (!*buf || *buf == '\n') {    /* check if buf was empty line */
        fprintf (stderr, "error: line is empty or contians only newline.\n");
        continue;
    }

    if (*buf < 'a' || 'z' < *buf) {  /* check first char not a-z */
        fprintf (stderr, "error: no lowercase char beginning line.\n");
        continue;
    }

让您确信至少您操作的线路有合理的机会匹配您要查找的内容。

现在你可以做if ... else if .... else if ....(这很好),或者因为你知道你主要关心检查值1-3,所以switch语句对于处理剩余的线。例如,您可以执行以下操作来解析那些需要查看的行的值:

    switch (rtn) {  /* switch on number of successful conversions */

        case 3:     /* three successful conversions */
            printf ("all values: '%c'  %d  %d\n", c, v1, v2);
            break;

        case 2:     /* two successful conversions */
            printf ("two values: '%c'  %d\n", c, v1);
            break;

        default:    /* one or less (need at least two */
            fprintf (stderr, "error: no character and value on line.\n");
    }

将所有这些部分放在一起,你可以做类似的事情:

#include <stdio.h>

#define MAXC 256

int main (void) {

    char buf[MAXC] = "";

    while (fgets (buf, MAXC, stdin))    /* read each line into buf */
    {
        char c;
        int v1, v2, rtn;     /* vars for values and sscanf return */

        rtn = sscanf (buf, "%c %d %d", &c, &v1, &v2); 

        if (rtn == 0) { /* no successful conversions took place */
            fprintf (stderr, "error: no values parsed from line.\n");
            continue;
        }

        if (!*buf || *buf == '\n') {    /* check if buf was empty line */
            fprintf (stderr, "error: line is empty or contians only newline.\n");
            continue;
        }

        if (*buf < 'a' || 'z' < *buf) {  /* check first char not a-z */
            fprintf (stderr, "error: no lowercase char beginning line.\n");
            continue;
        }

        switch (rtn) {  /* switch on number of successful conversions */

            case 3:     /* three successful conversions */
                printf ("all values: '%c'  %d  %d\n", c, v1, v2);
                break;

            case 2:     /* two successful conversions */
                printf ("two values: '%c'  %d\n", c, v1);
                break;

            default:    /* one or less (need at least two */
                fprintf (stderr, "error: no character and value on line.\n");
        }
    }

    return 0;
}

示例输入文件

$ cat dat/input.txt
a -1109180 699692587
a 1213834231 -226769626
c 994957275 2082945813
e 1213834231

有点杂乱的文件:

$ cat dat/rows.txt
a -1109180 699692587
a quick brown fox jumps over the lazy dog
a 1213834231 -226769626

c 994957275 2082945813
227 isn't good
e 1213834231

应该提供一个很好的测试,看看代码是否符合你的需要。通过代码运行数据提供:

示例使用/输出

$ /bin/sscanf_mixed <dat/input.txt
all values: 'a'  -1109180  699692587
all values: 'a'  1213834231  -226769626
all values: 'c'  994957275  2082945813
two values: 'e'  1213834231

杂乱的文件输出:

$ ./bin/sscanf_mixed <dat/rows.txt
all values: 'a'  -1109180  699692587
error: no character and value on line.
all values: 'a'  1213834231  -226769626
error: line is empty or contians only newline.
all values: 'c'  994957275  2082945813
error: no lowercase char beginning line.
two values: 'e'  1213834231

如您所见,两个输入文件提供了相同数量的转换,第二个只是注意到遇到不合格行时发生的错误或问题。

仔细看看,如果您有任何疑问,请告诉我。有很多方法可以解决问题的逻辑,但是你选择哪种方式,你想确保你构建所有输入例程足够灵活,以处理你应该合理期望的那些条件(空行等...)在现实世界中使用。