我必须使用flex和bison为简化的Python 3制作一个解析器,并且我得到了这两个错误。终端说它们是我写的78中的第79行。我有其他'.l'示例来自类,具有这种格式,它们工作正常
这就是我写的
%option noyywrap
%{
#define YYSTYPE double
#include "scanner.tab.h"
#include <stdlib.h>
#include <string>
extern int flag;
extern int line;
%}
DELIMITER [ ]+|[/t]+
KEYWORD False|class|finally|is|return|None|continue|for|lambda|try|True|def|from|nonlocal|while|and|del|global|not|with|as|elif|if|or|yield|assert|else|import|pass|break|except|in|raise
OPERATOR ([+\-$@&|^~])|(\*{1,2})|(\/{1,2})|(<[=<]?)|(>[=>]?)|(==)|!
COMMENT #.+
IDENTIFIER [a-zA-Z_][a-zA-Z0-9_]*
ID_ERR [0-9]{IDENTIFIER}
STRINGESCAPESEQ [\\].
SHORTSTRINGCHAR1 [^\\'\n]*
SHORTSTRINGCHAR2 [^\\"\n]*
SHORTSTRINGITEM1 {SHORTSTRINGCHAR1}|{STRINGESCAPESEQ}
SHORTSTRINGITEM2 {SHORTSTRINGCHAR2}|{STRINGESCAPESEQ}
STRING [']{SHORTSTRINGITEM1}*[']|(["]{SHORTSTRINGITEM2}*["])
STRING_ERR ['].[^'\n\t]*|["].[^"\n\t]*
BINDIGIT [01]
BININTEGER 0[bB]{BINDIGIT}+
BIN_ERR1 0[Bb]+{BINDIGIT}+
DIGIT [0-9]
NONZERODIGIT [1-9]
INTEGER {NONZERODIGIT}{DIGIT}*|[0]+
INT_ERR1 {INTEGER}[a-zA-Z]{DIGIT}
INT_ERR2 [-+]{INTEGER}
INT_ERR3 [0+]{INTEGER}
INTPART {DIGIT}+
EXPONENT [eE][+-]*{INTPART}
FRACTION [\.]{INTPART}
EXPONENTFLOAT ({INTPART}|{POINTFLOAT}){EXPONENT}
POINTFLOAT {INTPART}*{FRACTION}|{INTPART}[\.]
FLOATNUMBER {POINTFLOAT}|{EXPONENTFLOAT}
FLOAT_ERR_POINT {INTPART}*[\.]+{DIGIT}+[\.]*{DIGIT}*|{INTPART}[\.]+
FLOAT_ERR_SIGN ([-+]{FLOATNUMBER})
FLOAT_ERR_LETTER {FLOATNUMBER}[A-Za-z]+
IMAGINARYNUMBER ({FLOATNUMBER}|{INTPART})[jJ]
%%
{DELIMITER} { }
{KEYWORD} { return KEYWORD; }
{OPERATOR} { }
{COMMENT} { printf("Line %d: Found COMMENT\n", line); }
{IDENTIFIER} { printf("Line %d: Found IDENTIFIER %s\n", line, yytext); return IDENTIFIER; }
{ID_ERR} { printf("Line %d: !!ERROR!!\tWrong IDENTIFIER statement %s\n", line, yytext); return ID_ERR;}
{STRING} { printf("Line %d: Found STRING %s\n", line, yytext); return STRING; }
{STRING_ERR} { printf("Line %d: !!ERROR!!\tWrong STRING statement %s\n", line, yytext); return STRING_ERR;}
{BININTEGER} { printf("Line %d: Found BINARY INTEGER NUMBER %s\n", line, yytext); return BININTEGER; }
{BIN_ERR1} { printf("Line %d: !!ERROR!!\tWrong BINARY NUMBER statement, too many 'Bb's%s\n", line, yytext); return BIN_ERR1;}
{INTEGER} { printf("Line %d: Found INTEGER NUMBER %s\n", line, yytext); return INTEGER; }
{INT_ERR1} { printf("Line %d: !!ERROR!!\tWrong INT statement %s\n", line, yytext); return INT_ERR1;}
{INT_ERR2} { printf("Line %d: !!ERROR!!\tWrong INT statement, '+/-' found %s\n", line, yytext); return INT_ERR2;}
{INT_ERR3} { printf("Line %d: !!ERROR!!\tWrong INT statement, first digit(s) zeros %s\n", line, yytext); return INT_ERR3;}
{FLOATNUMBER} { printf("Line %d: Found FLOAT NUMBER %s\n", line, yytext); return FLOATNUMBER; }
{FLOAT_ERR_POINT} { printf("Line %d: !!ERROR!!\tWrong FLOAT statement, too many '.' %s\n", line, yytext); return FLOAT_ERR_POINT;}
{FLOAT_ERR_POINT} { printf("Line %d: !!ERROR!!\tWrong FLOAT statement, '+/-' FOUND %s\n", line, yytext); return FLOAT_ERR_SIGN;}
{FLOAT_ERR_LETTER { printf("Line %d: !!ERROR!!\tWrong FLOAT statement, letter FOUND %s\n", line, yytext); return FLOAT_ERR_LETTER;}
{IMAGINARYNUMBER} { printf("Line %d: Found IMAGINARY NUMBER %s\n", line, yytext); return IMAGINARYNUMBER; }
. { printf("Line %d: UNKNOWN TOKEN:%s", line, yytext); BEGIN(error);}
\n { line++; }
<<EOF>> { printf("#END OF FILE\n"); exit(0); }
完整的错误输出:
flex scanner.l
scanner.l:79: unrecognized rule
scanner.l:79: fatal parse error
答案 0 :(得分:3)
第74行末尾有一个缺失的括号:
{FLOAT_ERR_LETTER { printf("Line %d: !!ERROR!!\tWrong FLOAT statement, letter FOUND %s\n", line, yytext); return FLOAT_ERR_LETTER;}
^ <--- here
模糊地试图让这个答案对未来的读者有用,因为问题是一个简单的错字,这就是我发现问题的方法:
for n in {57..79}; do head -n$n g.l | flex -o /dev/null -w || { echo $n; break; } done
大多数情况下,flex输入结束后线上的致命错误是缺少大括号或其他类似问题的结果,但校对整个文件是一件痛苦的事情,令人惊讶的是很少有IDE正确的语法颜色flex文件。所以像上面这样的技巧可以节省大量时间。 (它并不总是那么简单;在这种情况下,没有任何行动跨越多条线。)
修复该错误后,您会发现无法匹配多个模式。第73行无法匹配,因为该模式与第72行({FLOAT_ERR_POINT}
)相同。第65行和第66行(BININTEGER
和BIN_ERR1
)无法匹配,因为相关模式(0B
后跟数字)也匹配IDERR
,这是(好奇地) )一个数字后跟一个标识符。 (您可能意味着[[:digit:]]+{IDENTIFIER}
。)总的来说,您应该在最后放置错误模式,以便它们永远不会优先于正确令牌的模式。这也使编写错误令牌变得更加简单。 (此外,您需要在更一般的错误模式之前添加特定的错误模式,以便BIN_ERR1
应该在IDERR
之前。)
其他一些评论:
如果要观看弹性匹配模式,请在命令行中添加--debug
(或-d
),而不是在代码中添加printf
命令。它可以更好地向您显示正在发生的事情,并且无需编辑整个文件即可打开和关闭。
&LT;&意见GT;
总的来说,在输入文件中过度使用flex宏并不是很有用。它实际上使得规范更难阅读,因为您必须查找宏的每次使用。就个人而言,我只需要在需要多次使用宏时使用宏,如果只是隐藏内置字符类(如[[:digit:]]
)的话,我就不会使用宏。
&LT; /&意见GT;