我正在为COOL(课堂面向对象语言)编写解析器/词法分析器。你可以在以下链接中看到语法:(手册的最后一页)
http://theory.stanford.edu/~aiken/software/cool/cool-manual.pdf
我正在使用ANTLR来编写这个程序,并且通过以下输入,我希望得到以下输出:
输入:
class Main inherits IO {
main(): Object {{
x <- 2 + 3 *4;
}};
};
输出:
1
2
3
11
6
16
27
18
27
27
但我得到的输出是:
1
2
3
11
6
27
16
27
18
27
这是我的解析器/词法分析器代码:
// parser
grammar CA2;
program : {System.out.println("1");} (classdef';')+ ;
classdef : {System.out.println("2");} CLASS ID (INHERITS ID)? '{' (feature';')* '}' ;
feature : {System.out.println("3");} ID OPENP (formal (','formal)*)? CLOSEP ':' ID '{' expr '}'
| {System.out.println("4");} ID ':' ID ( POINTTOLEFT expr )? ;
formal : {System.out.println("5");} ID ':' ID ;
expr : {System.out.println("6");} ID POINTTOLEFT expr exprprime
| {System.out.println("8");} ID OPENP ( expr (','expr)* )? CLOSEP exprprime
| {System.out.println("9");} IF expr THEN expr ELSE expr FI exprprime
| {System.out.println("10");} WHILE expr LOOP expr POOL exprprime
| {System.out.println("11");} '{' (expr';')+ '}' exprprime
| {System.out.println("12");} LET ID ':' ID (POINTTOLEFT expr)? (','ID ':' ID (POINTTOLEFT expr)?)* IN expr exprprime
| {System.out.println("13");} CASE expr OF (ID POINTTORIGHT expr ';')+ ESAC exprprime
| {System.out.println("14");} NEW ID exprprime
| {System.out.println("15");} ISVOID expr exprprime
/*| {System.out.println("16");} expr ADD expr
| {System.out.println("17");} expr SUB expr
| {System.out.println("18");} expr MULTIPLY expr
| {System.out.println("19");} expr DIV expr
| {System.out.println("20");} TILDA expr
| {System.out.println("21");} expr LARGERTHAN expr
| {System.out.println("22");} expr LARGEREQ expr
| {System.out.println("23");} expr EQUALS expr
| {System.out.println("24");} NOT expr
| {System.out.println("25");} OPENP expr CLOSEP
| {System.out.println("26");} ID
| {System.out.println("27");} INTEGER*/
| {System.out.println("28");} STRING exprprime | mathex exprprime ;
/*| {System.out.println("29");} TRUE
| {System.out.println("30");} FALSE ;*/
exprprime : {System.out.println("7");} (('@'ID)?)'.'ID OPENP (expr (','expr)*)? CLOSEP exprprime | ;
mathex : b ;
b : {System.out.println("24");} NOT b | c ;
cprime : {System.out.println("21");} LARGERTHAN d cprime
| {System.out.println("22");} LARGEREQ d cprime
| {System.out.println("23");} EQUALS d cprime | ;
c : d cprime ;
dprime : {System.out.println("16");} ADD e dprime
| {System.out.println("17");} SUB e dprime | ;
d : e dprime ;
eprime : {System.out.println("18");} MULTIPLY f eprime
| {System.out.println("19");} DIV f eprime | ;
e : f eprime ;
f : {System.out.println("20");} TILDA f | g ;
g : {System.out.println("25");} OPENP mathex CLOSEP
| {System.out.println("26");} ID
| {System.out.println("27");} INTEGER
| {System.out.println("29");} TRUE
| {System.out.println("30");} FALSE ;
//lexer
TRUE : 'true' ;
FALSE : 'false' ;
INHERITS : 'inherits' ;
CLASS : 'class' ;
IF : 'if' ;
THEN : 'then' ;
ELSE : 'else' ;
FI : 'fi' ;
WHILE : 'while' ;
LOOP : 'loop' ;
POOL : 'pool' ;
LET : 'let' ;
IN : 'in' ;
CASE : 'case' ;
OF : 'of' ;
ESAC : 'esac' ;
NEW : 'new' ;
ISVOID : 'isvoid' ;
NOT : 'not' ;
TILDA : '~' ;
WHITESPACE : [ ' '|'\r'|'\n'|'\t']+ ->skip ;
INTEGER : [0-9]+ ;
ID : ['_'a-zA-Z][a-zA-Z0-9'_']* ;
ADD : '+' ;
MULTIPLY : '*' ;
SUB : '-' ;
DIV : '/' ;
OPENP : '(' ;
CLOSEP : ')' ;
EQUALS : '=' ;
LARGERTHAN : '<' ;
LARGEREQ : '<=' ;
POINTTOLEFT : '<-' ;
POINTTORIGHT : '=>' ;
STRING : '"'(~[\r\n])*'"' ;
这是ANTLR中COOL语法的代码版本。在主代码中注释的部分被消除歧义(意味着模糊不清!)并且在第二部分(mathex规则)中释放了左递归。
任何人都可以指出哪里出错了,为什么我没有得到所需的输出?
提前感谢!
答案 0 :(得分:1)
除program
中的操作外,每个println
调用都会立即出现在语法中的标记引用之前。很明显,这意味着它们的执行顺序与令牌在文件中的显示顺序相同。
预期输出与实际输出之间的首次不匹配是行16
和27
的反转。只有输入中的+
标记出现在输入中的2
标记之前,才会出现您的预期输出,但很明显您可以看到情况并非如此。出于同样的原因发生第二次不匹配;特别是它是由于假设*
令牌的预期输出在语法中出现的时间早于3
令牌。
我注意到您最初编写了一个左递归expr
规则,并在其中包含了嵌入式操作。以下信息与解决您的具体问题无关,但如果您决定取消注释该代码并使用expr
的左递归形式,则必须了解这一点。
考虑以下左递归规则,允许简单添加标识符,并添加两个嵌入式操作。
expr
: {a();} ID
| {b();} expr '+' ID
;
正如您可能发现的那样,此语法不会使用ANTLR进行编译。我们发现在我在此处显示的位置评估表达式{b();}
会对生成的代码产生巨大的(负面)性能影响,因此我们选择不允许它。输出将是表达式的Polish prefix form,而解析器实际上是尝试使用infix notation对输入进行操作。解决方案是改为发出中缀符号:
expr
: {a();} ID
| expr {b();} '+' ID
;
通过收集a
和b
的调用结果,您可以在编写结果之前将结果转换为您喜欢的任何符号。另一个选择是将嵌入式操作移动到访问者,该访问者在完成解析后执行,其中琐事以您喜欢的任何顺序执行它们。