如何在JavaCC中的文本块中处理标记?

时间:2010-12-08 06:54:59

标签: java javacc

我有一个DSL的简单方面,我可以在其中定义一个键和一个值:

mykey=\
   This is my $REF{useful}
   multiline
   string
   where I terminate with a backslash
   but I support escaped \\ characters
   and I wish to handle the value part of this string
   as 3 blocks in this example.
\

本例中我想要的三个标记(值部分)是

  • ValueLiteral ==这是我的
  • ValueReference == $ REF {useful}
  • ValueLiteral == multiline etc ....

我为这个值定义了一个规则:

void multiLineValue(): {} {
  < BACKSLASH >< EOL >
  (
    valuePartLiteralMulti() |
    valuePartRef()
  )*
  < BACKSLASH >
}

以下是多线字符串类型的TOKEN定义:

TOKEN :
{
     < MULTILINE_STRING:(  ( (~["\\"])
    | ("\\"
        ( ["\\", "'", "\"", "$", "n", "r", "t", "b", "f"]
        | ["u", "U"]["+"]["0"-"9","a"-"f","A"-"F"]["0"-"9","a"-"f","A"-"F"]["0"-"9","a"-"f","A"-"F"]["0"-"9","a"-"f","A"-"F"]
        )
      ) ))+>
}

我的问题是我的多行字符串标记类型也使用'$ REF {'字符的字符序列。

我想修改这个多行字符串,以便在遇到未转义的“$ REF {”时停止使用字符(但会继续读取“\ $ REF {”序列)。

非常感谢任何帮助。

1 个答案:

答案 0 :(得分:2)

我不确定,但是在你的令牌定义中你还包括$(在unicode?中),也许你应该在beginnig中添加〜(“$”)(或unicode等价物)。

或者你可以使用合成LOOKAHEAD,比如LOOKAHEAD(valuePartRef())......

P.S。你有多个REF吗?