在以下lex / yacc文件中接收分段故障(核心转储)。他们怎么了?

时间:2017-01-13 17:45:27

标签: c yacc lex

我收到以下代码的分段错误(核心转储):

lex文件如下, test.l:

    %{

    #include "y.tab.h"

    #define LOOKUP 0

    int state;

    int add_word(int type, char *word);
    int lookup_word(char *word);
    %}

    %%

    \n {state = LOOKUP;}
    \.\n {state = LOOKUP;
            return 0;
        }

    ^verb {state = VERB;}
    ^adj {state = ADJECTIVE;}
    ^adv {state = ADVERB;}
    ^noun {state = NOUN;}
    ^prep {state = PREPOSITION;}
    ^pron {state = PRONOUN;}
    ^conj {state = CONJUNCTION;}

    [a-zA-Z]+ {
                if(state != LOOKUP){
                    add_word(state, yytext);
                }else{
                    switch(lookup_word(yytext)){
                        case VERB: return(VERB);
                        case ADJECTIVE: return(ADJECTIVE);
                        case ADVERB: return(ADVERB);
                        case NOUN: return(NOUN);
                        case PREPOSITION: return(PREPOSITION);
                        case PRONOUN: return(PRONOUN);
                        case CONJUNCTION: return(CONJUNCTION);
                        default:
                            printf("%s: don't recog\n",yytext);
                    }
                }
                }
    . ;

    %%
    struct word{
        char *word_name;
        int word_type;
        struct word *next;
    };

    struct word *word_list;

    extern void *malloc();

    int add_word(int type, char *word){
        struct word *wp;
        if(lookup_word(word) != LOOKUP){
            printf("word %s already defined\n", word);
            return 0;
        }

        wp = (struct word *) malloc(sizeof(struct word));

        wp-> next = word_list;

        wp-> word_name = (char*) malloc(strlen(word)+1);
        strcpy(wp->word_name, word);
        wp->word_type = type;
        word_list = wp;
        return 1;
    }

    int lookup_word(char *word){
        struct word *wp = word_list;

        for(; wp; wp = wp->next){
        if(strcmp(wp->word_name, word) == 0)
            return wp->word_type;
        }
        return LOOKUP;
    }

yacc文件如下,

test.y:

%{

#include <stdio.h>

%}

%token NOUN PRONOUN VERB ADVERB ADJECTIVE PREPOSITION CONJUNCTION

%%
sentence: subject VERB object {printf("sentence is valid\n");}
        ;

subject: NOUN
        | PRONOUN
        ;
object: NOUN
        ;

%%

extern FILE *yyin;

main(){ 
    while(!feof(yyin)){
        yyparse();
    }
}

yyerror(s)
{
    fprintf(stderr, "some error\n");
}

我已经花了好几个小时才弄明白问题是什么。我对这些事情都很陌生,并且跟着这本书&#34; O&#39; reilly - Lex和Yacc&#34;。

1 个答案:

答案 0 :(得分:1)

由(f)lex(负责执行输入的组件)生成的扫描程序分别在yyinyyoutstdinstdout期间初始化它的初始化功能。在此之前,它们都是NULL指针,这是C的静态初始化规则(即全局指针变量初始化为NULL)的结果。

第一次调用yylex时调用初始化函数。 (它设置一个标志,以便下一次调用yylex不再进行初始化。这是初始化库系统的一种非常典型的方法;大多数malloc实现和C {{1}的一些实现函数执行相同的操作。)

stdio重复调用

yylex,因此第一次调用yyparse会隐式初始化yyparse。但是当你写道:

yylex

main(){ while(!feof(yyin)){ yyparse(); } } 的首次使用在初始化之前发生。因此,第一次评估yyin条件时,while仍为yyin,因此没有第二次;由此产生的段错误是致命的。

您可以通过自己初始化NULL来解决此问题,但由于 yyin总是错误(sm),因此将EOF测试放在<循环的em> end :

while (!feof(file))

请参阅this very helpful SO answer问题为什么“int main(){ do yyparse(); while (!feof(yyin)); } ”总是错误?进行详细分析。