我希望我的解析器处理如下情况:
a='A'; // a should be set with ASCII(A) i.e 65
我的令牌声明如下:
%union {
double dval;
char *symbol;
}
%token <symbol> SYMBOL_NAME
%token <dval> NUMBER
%token BINARY
%token OCTAL
%token DECIMAL
%token HEXADECIMAL
%token UNSIGNED
%token <symbol>CHAR
%token SHORT
%token INT
%token LONG
我的声明声明如下:
statement: ';'
| expression { setp($1); print_universal_base($1, 0); }
| expression BINARY { setp($1); print_universal_base($1, 2); }
| expression OCTAL { setp($1); print_universal_base($1, 8); }
| expression DECIMAL { setp($1); print_universal_base($1, 10); }
| expression HEXADECIMAL { setp($1); print_universal_base($1, 16); }
我的表达式声明如下:
expression: expression ',' expression { $$ = $3; }
| SYMBOL_NAME '=' expression { if(assign_value($1, $3, &$$)) YYABORT; }
| NUMBER { $$ = $1; }
| '\'' CHAR '\'' { if(set_ASCII($2, &$$)) YYABORT; }
不应该
'\'' CHAR '\'' { if(set_ASCII($2, &$$)) YYABORT; }
处理我的案子? 当我输入像
时,我看到了a='A';
未调用set_ASCII()。这里有什么不对的?
答案 0 :(得分:3)
这里有什么不对?
答案几乎肯定在于解析器的弹性方面:它永远不会返回CHAR
标记。
您尚未向我们展示解析器的弹性面,但您如何区分SYMBOL_NAME
和CHAR
?通常,检测<single_quote> <char> <single_quote>
序列的代码是在flex中实现的,而不是野牛。 <char>
存储在union中,返回值CHAR
。在野牛方面,将'\'' CHAR '\''
模式更改为CHAR
。
或者,只需将'\'' CHAR '\''
模式更改为'\'' SYMBOL_NAME '\''
。