C中的POSIX正则表达式无效

时间:2011-09-24 17:22:51

标签: c regex

我希望匹配两个单词GET和HTTP之间的所有内容。我尝试了所有我认识的事情。但它没有用。任何帮助赞赏。模式GET。* HTTP应与GET www.google.com HTTP匹配。

这是代码

接头:

#include <sys/types.h>
#include <regex.h>
#include <stdio.h>
#include <stdlib.h>
#include <string.h>

主:

int main(int argc, char *argv[]) {
    regex_t regex;
    int reti;
    char msgbuf[100];
    regmatch_t pmatch[1];

    /* Compile regular expression */
    reti = regcomp(&regex, "GET.*HTTP", REG_EXTENDED);
    if (reti) {
        fprintf(stderr, "Could not compile regex\n");
        exit(1);
    }

    /* Execute regular expression */
    reti = regexec(&regex, argv[1], 1, pmatch, 0);

    if (!reti) {
        puts("Match");
        char *match = strndup(argv[1] + pmatch[0].rm_so, pmatch[0].rm_eo - pmatch[0].rm_so);

        printf("%s\n",match);
    } else if (reti == REG_NOMATCH) {
        puts("No match");
    } else {
        regerror(reti, &regex, msgbuf, sizeof(msgbuf));
        fprintf(stderr, "Regex match failed: %s\n", msgbuf);
        exit(1);
    }

    /* Free compiled regular expression if you want to use the regex_t again */
    regfree(&regex);

    return 0;
}

我在这里做错了什么。

1 个答案:

答案 0 :(得分:4)

看起来我的评论就是答案......

问题是命令行参数被切成3个字符串,使argv[1]仅指向GET

要将整个字符串传递给程序,必须使用双引号:

$ ./regex GET www.google.com HTTP
No match
$ ./regex "GET www.google.com HTTP"
Match
GET www.google.com HTTP
$