为什么C的regexec()与这个模式不匹配,但是javascript的match()有效吗?

时间:2012-03-11 15:17:54

标签: c regex

我有这种模式[-]{23}[ ]*Page[ ]*[0-9]*[-]{23}从像----------------------- Page 1-----------------------这样的字符串中提取页码,使用javascript regex实现它可以正常工作:

var s = "----------------------- Page 1-----------------------";
alert( s.match(/[-]{23}[ ]*Page[ ]*[0-9]*[-]{23}/) != null);

match()函数返回匹配的字符串值,如果pattern与string不匹配,则返回null。上面的代码显示true

我的C代码:

#include <assert.h>
#include <sys/types.h>
#include <regex.h>

//... 

regex_t reg;
regmatch_t match;
char * line = "----------------------- Page 1-----------------------";
regcomp(&reg,
          "[-]{23}[ ]*Page[ ]*[0-9]*[-]{23}",
          REG_ICASE /* Don't differentiate case */
    );

int r = regexec(&reg,
         line, /* line to match */
         1, /* size of captures */
         &match,
         0); 

if( r == 0) { printf("Match!"); } else { printf("NO match!"); }

上面的if语句打印NO match!我不知道如何解决这个问题。提前谢谢。

1 个答案:

答案 0 :(得分:11)

要使正则表达式库识别完整的正则表达式,请在regcomp标志中使用REG_EXTENDED。

  

可以使用groups

你的意思是捕捉团体?喜欢这个?

#include <assert.h>
#include <stdio.h>
#include <sys/types.h>
#include <regex.h>

int main(void) {
  int r;
  regex_t reg;
  regmatch_t match[2];
  char *line = "----------------------- Page 1-----------------------";

  regcomp(&reg, "[-]{23}[ ]*Page[ ]*([0-9]*)[-]{23}", REG_ICASE | REG_EXTENDED);
  /*                                ^------^ capture page number */
  r = regexec(&reg, line, 2, match, 0);
  if (r == 0) {
    printf("Match!\n");
    printf("0: [%.*s]\n", match[0].rm_eo - match[0].rm_so, line + match[0].rm_so);
    printf("1: [%.*s]\n", match[1].rm_eo - match[1].rm_so, line + match[1].rm_so);
  } else {
    printf("NO match!\n");
  }

  return 0;
}