Question

有没有办法让ANTLR4自动删除生成的解析树中的冗余节点？

更具体地说，我一直在试验GLSL的语法，并且由于规则转发需要自动处理运算符优先级，因此您最终会在解析树中使用长线性序列“表达式”。

大多数生成的树节点只是“转发到下一级优先级”，因此不提供任何有用的语法信息 - 您只需要每个序列中的最后一个表达式节点（即规则的点）转发已停止），或者它成为具有多个子节点的实际树节点的点（即在源中遇到实际表达式）...

我希望有一种简单的方法来消除虚拟中间表达式节点 - 这种类型的结构必须在任何具有运算符优先级的语法中都是通用的。

语法的基本结构是从Khronos语言规范中取得的相当直接的克隆：

https://www.khronos.org/registry/gles/specs/3.1/es_spec_3.1.pdf

Answer 1

如果使用这样的语法（基本数学示例），ANTLR v4能够从处理不同优先级的单个递归规则生成代码：

expr : '(' expr ')'
     | '-' expr
     | expr ('*'|'/') expr
     | expr ('+'|'-') expr
     | INT
     ;

ANTLR v3无法执行此操作，并且基本上要求您按优先级编写一个规则。所以我建议你重写你的语法，以避免这些样板规则。

然后，我认为你将parse tree (aka concrete syntax tree)与AST (abstract syntax tree)混为一谈。 AST就像解析树的简化版本，只保留了您的目的所需的内容。例如，使用上面的expr规则，AST将不包含括号的任何节点，因为优先级在树本身中编码，并且您通常不需要知道给定表达式的一部分是否是括号还是不括号。

你的程序应该从解析树中构建一个AST然后从那里开始。不要直接处理解析树，即使它看起来很方便，因为该工具为你生成它们。它会很快变得麻烦。构建您自己的树结构（AST），为手头的任务量身定制。

Answer 2

使用Visitor实现按顺序访问每个节点。通过在访问父节点时向其添加节点来构建自己的树。在访问节点时确定是否将其添加到新树中。例如：

public T visitExpression(@NotNull AcParser.ExpressionContext ctx) {
        // Expressionable parent = getParent(Expressionable.class, ctx);
        // Class<? extends AcExpression> expClass = AcExpression.class;
        AcExpression obj = null;
        String text = ctx.getText();

        //do something with text or children
        for (int i=0; i<ctx.getChildCount(); i++){
            printnl(ctx.getChild(i).getText()+"/");
        }

        return visitChildren(ctx);
    }

ANTLR4解析树简化

2 个答案: