定义标记的“组”

时间:2012-05-15 19:34:51

标签: java parsing javacc

我正在使用JavaCC编写一个简单语言的解析器。

在我的令牌声明部分,我有类似的内容

< CONSTANT: < INTEGER > | < FLOAT_NUMBER > | < BOOLEAN > >

< INTEGER: "0" | ("-")? ["1"-"9"](["0"-"9"])* | "0x" (["0"-"9"] | ["a"-"f"]  | ["A"-"F"])+ >
< FLOAT_NUMBER: ("-")? (["0"-"9"])+ "." (["0"-"9"])+ ("E" ("-")? (["0"-"9"])+)? ("D")? >
< BOOLEAN: "true" | "false">

CONSTANT由于其顺序,优先级高于INTEGER。但是,我需要一个INTEGER语法的部分内容。在这些情况下,解析器会抛出异常,因为INTEGER被解析为CONSTANT

一个简单的解决方案是删除CONSTANT令牌并为(< INTEGER > | < FLOAT_NUMBER > | < BOOLEAN >)查找并替换它。不过,这感觉相当笨重。

有没有办法将CONSTANT简单地定义为其他令牌的分组,这样CONSTANT本身不是令牌,而是(< INTEGER > | < FLOAT_NUMBER > | < BOOLEAN >)的简写?

感谢您的时间。

1 个答案:

答案 0 :(得分:2)

我认为这里的简单答案是你不应该在tokenizer中这样做。

最好将其纳入生产规则,例如:

Token parseConstant() :
{
    Token t;    
}

{
    (
      t = < INTEGER > | t = < FLOAT_NUMBER > | t = < BOOLEAN >
    )
    {
      return t;
    }

}