在C中使用regexec / strtok_r时出现分段错误

时间:2016-04-22 22:24:20

标签: c regex segmentation-fault strtok

我在确定接收分段错误的位置和原因方面遇到了问题。

我正在编写一个C代码,提示用户输入正则表达式并编译它,然后输入一个包含多个句子的字符串:

int main(void){

  char RegExp[50];
  regex_t CompiledRegExp;
  char *para;
  char delim[] = ".!?,";
  char *sentence;
  char *ptr1;

  printf("Enter regular expression: ");
  fgets(RegExp, 50, stdin);

if (regcomp(&CompiledRegExp,RegExp,REG_EXTENDED|REG_NOSUB) != 0) {                        

    printf("ERROR: Something wrong in the regular expression\n");                         

    exit(EXIT_FAILURE);                                                                   

  }

  printf("\nEnter string: ");

strtok_r用于将字符串拆分为以下任一分隔符。,?!然后生成的标记(句子)用作regexec函数中的字符串参数,该函数搜索它以查看先前编译的正则表达式是否包含在标记中:

if( fgets(para, 1000, stdin)){

    char *ptr = para;
    sentence = strtok_r(ptr, delim, &ptr1);

    while(sentence != NULL){

      printf("\n%s", sentence);

      if (regexec(&CompiledRegExp,sentence,(size_t)0,NULL,0) == 0) {
        printf("\nYes");
      } else {
        printf("\nNo");
      }
      ptr = ptr1;
      sentence = strtok_r(ptr, delim, &ptr1);

    }
  }
regfree(&CompiledRegExp);
}

这可能是我犯下的一个愚蠢的错误,但是在找到segfaul的原因方面的任何帮助都将不胜感激!

编辑 regfree移至更合适的位置。但是,段错误仍在发生。我很确定它与正在阅读的正则表达式如何或在regexec中如何进行比较有关。但是,无能为力。

3 个答案:

答案 0 :(得分:3)

而不是:

char *para;
fgets(para, 1000, stdin);

写下这个:

char para[1000];
fgets(para, 1000, stdin);

在第一个版本中,para是指向内存中某处的指针,而某处则会写入用户输入的字符串。最有可能的是,para指向某个无效的地址,会立即导致程序崩溃。

答案 1 :(得分:2)

你在循环中调用了regfree。第二次围绕循环,在未定义的行为上调用释放内存上的regexec。

答案 2 :(得分:0)

您错误地使用了strtok_r()

要解析带有strtok_r()的字符串,在第一次调用中,第一个参数是指向要解析的字符串的指针。后续调用strtok_r()来解析相同的字符串应该将NULL作为第一个参数传递。你在做什么:

ptr = ptr1;  
sentence = strtok_r(ptr, delim, &ptr1); 

毫无意义。