antlr 词法分析器和解析器的转义字符

时间:2021-02-01 16:12:09

标签: java antlr

我是 antlr 的新手并希望构建一个解析器,其中一部分需要我匹配字符串,但是我希望保留转义字符的含义

\0, \b, \t, \n, \f, \r, \", \', \\

其中一些符号在我的语言位置的语法中以各种方式使用,因此我希望通过以下方式定义 ESCAPE_CHAR 标记:

SINGLE_QUOTE: '\'' ;
DOUBLE_QUOTE: '"' ;
ESCAPE_ZERO : '\0' ;
ESCAPE_BACKSPACE : '\b' ;
ESCAPE_TAB : '\t' ;
ESCAPE_NEWLINE : '\n' ;
ESCAPE_FORMFEED : '\f' ;
ESCAPE_CARRIAGERETURN : '\r' ;
ESCAPE_BACKSLASH : '\\' ;
ESCAPE_CHAR: ESCAPE_ZERO | ESCAPE_BACKSPACE | ESCAPE_TAB | ESCAPE_NEWLINE | ESCAPE_FORMFEED | ESCAPE_CARRIAGERETURN | DOUBLE_QUOTE | SINGLE_QUOTE | ESCAPE_BACKSLASH ;

但是,ESCAPE_ZERO 给了我警告

non-fragment lexer rule ESCAPE_CHAR can match the empty string

当使 ESCAPE_ZERO 成为片段时,我看到警告

invalid escape sequence \0

我是 antlr 的新手,所以我真的不知道我需要做哪些改变,任何帮助将不胜感激

1 个答案:

答案 0 :(得分:1)

您还需要转义 ANTLR 中文字中的 \。如果不这样做,词法分析器规则 ESCAPE_ZERO : '\0' ; 将匹配空字符而不是反斜杠后跟零位。并且这个空字符没有“宽度”,这会导致 ANTLR 产生错误 [...] 可以匹配空字符串

代替所有单独的规则,试试这样的:

STRING
 : '"' ( ~[\\"\r\n] | ESCAPE_CHAR )* '"'
 ;

fragment ESCAPE_CHAR
 : '\\' [0btnfr"'\\]
 ;