C字符串字符串比较总是导致错误的

时间:2019-07-17 18:24:22

标签: c linux string file

我正在尝试在文件中查找字符串。我通过修改getline手册页中提供的代码段来编写以下内容。

#define _GNU_SOURCE
#include <stdio.h>
#include <stdlib.h>
#include <string.h>

int main(void)
{
    FILE * fp;
    char * line = NULL;
    char *fixed_str = "testline4";
    size_t len = 0;
    ssize_t read;

    fp = fopen("test.txt", "r");
    if (fp == NULL)
        exit(EXIT_FAILURE);

    while ((read = getline(&line, &len, fp)) != -1) {
        printf("Retrieved line of length %zu:\n", read);
        printf("%s", line);

        if (strcmp(fixed_str,line)==0)
            printf("the match is found\n");
    }
    //printf("the len of string is %zu\n", strlen(fixed_str));

    fclose(fp);
    if (line)
        free(line);
    exit(EXIT_SUCCESS);
} 

问题在于,即使getline成功且正确地迭代了文件中的所有行,strcmp的结果也始终为false。 由于换行符(AM I RIGHT?),fixed_str的长度为9,文件中相等字符串的长度为10。但是在strncmp的帮助下比较9个字符仍然会产生错误的结果。我还排除了上限和空格的可能性,所以我认为我做错了什么

test.txt如下

test line1
test line2
test line3
testline4
string1
string2
string3
first name

我尝试了所有条目,但没有成功

注意::在我的实际程序中,我必须从另一个文件中读取fixed_str

1 个答案:

答案 0 :(得分:5)

来自getline() man page(我的 重点 ):

  

getline()从流中读取整行,并存储          包含文本到* lineptr的缓冲区。缓冲区为空-          已终止,并且 包含换行符 (如果已找到)。

您的fixed_str没有换行符。

因此剥离任何换行符(例如):

char* nl = strrchr( line, '\n' ) ;
if(nl != NULL) *nl = `\0` ;

或更有效,因为getline()返回行长(在您的情况下为read):

if(line[read - 1] == '\n' ) line[read - 1] = `\0` ;

'\n'上添加fixed_str似乎更简单,但这不是一个好主意,因为文件中的最后一行(或唯一一行)没有一行,否则可能是匹配项。 / p>

按照问题中的说明使用strncmp()应该可以,但是没有看到尝试就很难发表评论,但是在任何情况下它都是有缺陷的解决方案,因为它可以匹配 all 例如:

testline4
testline4 and some more
testline4 12345.

如果fixed_str是从控制台或文件输入而不是常量中获取的,则输入方法和数据源可能会引起问题,并且可能会出现其他行尾约定。要使其更强大,您可以这样做:

// Strip any LF or CR+LF line end from fixed_str
char* line_end = strpbrk( fixed_str, "\r\n" ) ;
if( line_end != NULL ) *line_end = '\0' ;  

// Strip any LF or CR+LF line end from line
line_end = strpbrk( line, "\r\n" ) ;
if( line_end != NULL ) *line_end = '\0' ;  

或者@AndrewHenle指出的更简单(即更好)的解决方案:

// Strip any LF or CR+LF line end from fixed_str
fixed_str[strcspn(line, "\r\n")] = '\0';

// Strip any LF or CR+LF line end from line
line[strcspn(line, "\r\n")] = '\0';

这样一来,无论输入行以CR或CR + LF结尾,都可以比较任一输入,并且两个输入之间的行结束甚至可以有所不同。