如何解决这个选择冲突--JavaCC

时间:2012-12-20 09:41:34

标签: grammar parser-generator operator-precedence javacc

我有一个javacc语法,它定义了一个简单的脚本语言,其中包含简单的表达式和条件语句,我正在审查并尝试纠正大致定义如下:

void Statement() : {}
{
Assignment()
|
IfStatement()
}

void Assignment() : {}
{
  RealIdentifier() "=" SimpleExpression()
|
  StringIdentifier() "="  StringExpression()
}

void IfStatement() : {}
{
  "IF" Expression() "THEN" Block()
  (
    "ENDIF;"
  |
    "ELSE" Block() "ENDIF;"
  )
}
void Expression() #void : {}
{
  SimpleExpression()
  (
    "<" SimpleExpression() #LTNode(2)
  |
    ">" SimpleExpression() #GTNode(2)
  |
    "<=" SimpleExpression() #LENode(2)
  |
    ">=" SimpleExpression() #GENode(2)
  |
    "==" SimpleExpression() #EQNode(2) 
  |
    "!=" SimpleExpression() #NENode(2)
  )*
}

void SimpleExpression() #void : {}
{
  Term()
  (
    "+" Term()  #AddNode(2)
  |
    "-" Term()  #SubsNode(2)
  |
    "|" Term() #OrNode(2)
  )*
}

void Term() #void : {}
{
  Factor()
  ( 
    "*" Factor() #MultNode(2)
  |
    "/" Factor() #DivNode(2)
  |
    "&" Factor() #AndNode(2)
  )*
}

void Factor() #void : {}
{
  Real()
|
  RealIdentifier()
|
  Function()
|
  "(" Expression() ")"
|
  "!" Factor() #NotNode(1)
|
  StringExpression()
}

void Function() : 
{
  Token t;
  int args = 0;
}
{
t = <FUNCTION> { jjtThis.setID(t.image, legacyCharset); } "(" args = ArgumentList() ")"  
  { jjtThis.setArgs(args); }
}

int ArgumentList() #void : 
{
  int args = 0;
}
{
  Expression() {args++;} ( "," Expression() {args++;} )*
  { return args; }
}

void StringIdentifier() :
{
Token t;
}
{
t = <STRING_IDENTIFIER>
{
System.out.println("kind="+t.kind+" image="+t.image);
}
}

void RealIdentifier() : 
{
Token t;
}
{
t =  <REAL_IDENTIFIER>
{
System.out.println("kind="+t.kind+" image="+t.image);
}
}

第一个明显的问题是Expression的定义方式,因为它用于定义IfStatement,我很容易得到这样的结果: 如果(variable1&lt; variable2&gt; = variable3)

我试图通过将条件表达式的逻辑与一般表达式的逻辑分开来纠正这一点:

void IfStatement() : {}
{
  "IF" ConditionalExpression() "THEN" Block()
  (
    "ENDIF;"
  |
    "ELSE" Block() "ENDIF;"
  )
}
void ConditionalExpression() #void : {}
{
  SimpleExpression()
  (
    "<" #LTNode(2)
  |
    ">" #GTNode(2)
  |
    "<=" #LENode(2)
  |
    ">=" #GENode(2)
  |
    "==" #EQNode(2) 
  |
    "!=" #NENode(2)
  )SimpleExpression()
}
void Expression() #void : {}
( SimpleExpression() )*
}

编译生成的jj文件时,我收到以下警告: 警告:(...)*构造中的选择冲突在第210行第3列。          扩展嵌套在构造之后的构造和扩展中          有共同的前缀,其中一个是:“+”          考虑使用2或更多的前瞻来进行嵌套扩展。

错误行号是生成的jj文件中的一行。我假设冲突是在封装SimpleExpression时,因为它无法弄清楚正在解析的是ConditionalExpression还是Expression,所以我尝试了:

void Expression() #void : {}
{
  ( LOOKAHEAD(2) SimpleExpression() )*
}

然后

void ConditionalExpression() #void : {}
{
( LOOKAHEAD(2)
  SimpleExpression()
  (

但它并没有消失。 jj文件中表示存在选择冲突的行

void Statement() : {/*@bgen(jjtree) Statement */
  ASTStatement jjtn000 = new ASTStatement(JJTSTATEMENT);
  boolean jjtc000 = true;
  jjtree.openNodeScope(jjtn000);
/*@egen*/} // <-------------------------------------- line 210
{/*@bgen(jjtree) Statement */
  try {
/*@egen*/
  Assignment()
|

另一个问题是运算符优先级在某种程度上搞砸了,就像这样 IF(“a”==“a”|“c”==“c”) 结果在|在使用“c”作为其第二个操作数并且给出ClassCastException的第二个==运算符之前被解释,我得出结论,修复这个需要重写整个语法,所以我想到可能强制复合单个条件的括号像这样的条件陈述 if((“a”==“a”)|(“c”==“c”)) 我只是无法弄清楚如何做到这一点。

2 个答案:

答案 0 :(得分:2)

使用*代替kleen-star,?,使关系表达式的右侧(包括运算符)可选,这样一个SimpleExpression()也可以匹配:

void Expression() #void : {}
{
  SimpleExpression()
  ( "<"  SimpleExpression() #LTNode(2)
  | ">"  SimpleExpression() #GTNode(2)
  | "<=" SimpleExpression() #LENode(2)
  | ">=" SimpleExpression() #GENode(2)
  | "==" SimpleExpression() #EQNode(2) 
  | "!=" SimpleExpression() #NENode(2)
  )?
}

这不应该产生任何冲突,AFAIK。

答案 1 :(得分:0)

第二个问题

  

另一个问题是运算符优先级在某种程度上被搞砸了,类似于IF(“a”==“a”|“c”==“c”)会导致|在第二个==运算符之前被解释,使用“c”作为其第二个操作数并且给出了ClassCastException,

由于您没有发布与|运算符相关的语法规则,因此很难诊断。不应要求您提出的解决方案。

我希望你不介意对语言设计的评论:尝试使用语法强制类型正确性通常是一个糟糕的选择。