想跳过除antlr4语法中的两个以外的所有行注释

时间:2014-10-15 10:27:18

标签: parsing antlr4

我想稍微扩展IDL.g4语法,以便我可以区分以下两条评论//@top-level false//@top-level true,以及我之前想要跳过的所有其他评论。

我试图像这样添加top_levelTOP_LEVEL_TRUETOP_LEVEL_FALSE,因为我认为antr4优先考虑首先出现的词汇规则。

top_level
  : TOP_LEVEL_TRUE
  | TOP_LEVEL_FALSE
  ;

TOP_LEVEL_TRUE
  : '//@top-level true'
  ;

TOP_LEVEL_FALSE
  : '//@top-level false'
  ;

LINE_COMMENT
  : '//' ~('\n'|'\r')* '\r'? '\' -> channel(HIDDEN)
  ;

但是从不调用监听器enterTop_level(...), 所有评论似乎都被LINE_COMMENT吃掉了。我该如何组织词法分析器和解析器规则?

还有一个问题,我还希望在到达输入文件结束时收到通知。我怎么做?我在侦听器类中尝试了finalize()函数,但从未被调用过。

更新了一个完整的示例:

我使用这个语法文件:IDL.g4如上所述。然后我通过将解析器规则top_level放在event_header规则下面来更新它。 Lexer规则就位于ID规则之上。

这是我的Listener.java文件

class Listener extends IDLBaseListener {
    @Override
    public void enterTop_level(IDLParser.Top_levelContext ctx) {
        System.out.println("Found top-level");
    }
}

这是一个主程序:IDLCheck.java

import org.antlr.v4.runtime.*;
import org.antlr.v4.runtime.tree.ParseTreeWalker;
import java.io.FileInputStream;
import java.io.InputStream;

public class IDLCheck {
    public void process(String[] args) throws Exception {
        InputStream is = new FileInputStream("sample.idl");
        ANTLRInputStream input = new ANTLRInputStream(is);
        IDLLexer lexer = new IDLLexer(input);
        CommonTokenStream tokens = new CommonTokenStream(lexer);
        IDLParser parser = new IDLParser(tokens);
        parser.setBuildParseTree(true);
        RuleContext tree = parser.specification();
        Listener listener = new Listener();
        ParseTreeWalker walker = new ParseTreeWalker();
        walker.walk(listener, tree);    
  }

  public static void main(String[] args) throws Exception {
      new IDLCheck().process(args);
  }
}

和输入文件:sample.idl

module CommonTypes {
  struct WChannel {
    int w;
    float d;
  }; //@top-level false
  struct EPlanID {
    int kind;
    short index;
  }; //@top-level TRUE
};

我希望看到输出“找到顶级”两次,但我什么也看不见

1 个答案:

答案 0 :(得分:0)

最后我找到了解决方案。我刚刚在TOP_LEVEL_FALSETOP_LEVEL_TRUE词法分析器规则中添加了换行符,我还将top_level解析器规则添加到定义规则中,因为我只希望top_level出现在struct或union之后。这是IDL格式的rti.com特定扩展,这个修改对我来说似乎已经足够了。

definition
  : type_decl SEMICOLON top_level?
  | const_decl SEMICOLON
  ...

TOP_LEVEL_TRUE
  : '//@top-level true' '\r'? '\n'
  ;

TOP_LEVEL_FALSE
  : '//@top-level false' '\r'? '\n'
  ;