我可能会问一个愚蠢/基本的问题,但我对ANTLR AST建设感到困惑。
我想要做的是一种布尔表达式解析器,这样在父节点上我有操作符及其操作数作为子节点。 例如,一句话
((A B C& D)|(E&(F | G)))
理想情况下应该代表
|
/ \
/ \
/ \
/ \
& &
/ \ / \
/ \ / \
/ D E |
/|\ / \
A B C / \
F G
来自以下语法。
grammar Test;
options
{
language = 'Java';
output=AST;
}
exp : word (expRest^)? | '('! exp ')'! (expRest^)? ;
expRest : (('&'|'|'|'!'|'&!'|'|!')^) exp | (('~'^) digit+ exp);
word : letter letter* -> ^(letter letter*);
letter : '0'|'1'|'2'|'3'|'4'|'5'|'6'|'7'|'8'|'9'|'a'|'b'|'c'|'d'|'e'|'f'|'g'|'h'|'i'|'j'|'k'|'l'|'m'|'n'|'o'|'p'|'q'|'r'|'s'|'t'|'u'|'v'|'w'|'x'|'y'|'z'|'A'|'B'|'C'|'D'|'E'|'F'|'G'|'H'|'I'|'J'|'K'|'L'|'M'|'N'|'O'|'P'|'Q'|'R'|'S'|'T'|'U'|'V'|'W'|'X'|'Y'|'Z';
digit : '0'|'1'|'2'|'3'|'4'|'5'|'6'|'7'|'8'|'9';
问题是,我将'A B C'作为节点的列表(数组)作为'&'的子节点。
是否可以将其限制为单个字符串???即'A B C' 或者换句话说,是否可以在AST中的根节点处有多个字符?如果是,那我该如何实现呢?
供参考,我想制作一个'风险因素&当前的经济状况'
P.S。我也尝试过:
word : (letter letter*)^ ;
仅供参考,我使用的是.NET环境。
答案 0 :(得分:3)
您可以在语法中插入虚构标记,这些标记将成为单词“组”的根。我认为将A
,B
和C
粘合在一起并不是一个好主意,因为你可能需要将它们分开,对吗?
我无法弄清楚你到底想要做什么,所以这里有一个小小的演示,你可以(试着)了解一下:
grammar BoolExp;
options {
output=AST;
}
tokens {
MultiWord;
}
parse
: booleanExp EOF!
;
booleanExp
: orExp
;
orExp
: andExp ('|'^ andExp)*
;
andExp
: notExp ('&'^ notExp)*
;
notExp
: '!'^ atom
| atom
;
atom
: '(' booleanExp ')' -> booleanExp
| WORD WORD+ -> ^(MultiWord WORD+)
| WORD
;
WORD
: ('a'..'z' | 'A'..'Z')+
;
SPACE
: (' ' | '\t' | '\r' | '\n'){skip();}
;
如果您从中生成解析器并使用输入进行测试:
( ( A B C & D ) | ( E & ( F | G ) ) )
您将获得以下AST:
我没有发布生成用于创建AST图像的DOT文件的(Java)测试类,因为您说您正在使用.NET目标。如果您确实想看一下,请发表评论,我也会发布。
答案 1 :(得分:0)
如果你想要'A B C'作为单个节点,那么定义字母以包括''之间的字符:
letter : character (space character)*;
character : '0'..'9'|'a'..'z'|'A'..'Z';
space : ' ';
其中包含空格作为字母节点的子节点。