ANTLR4:使用单独的语法时出现grun错误(ClassCastException)

时间:2019-01-24 23:08:10

标签: antlr4

说明

我正在尝试创建一种自定义语言,希望将词法分析器规则与解析器规则分开。此外,我的目标是将词法分析器和解析器规则进一步划分为特定的文件(例如,常见的词法分析器规则和关键字规则)。

但是我似乎无法使它正常工作。

尽管在生成解析器(.java文件)时没有出现任何错误,但是grun失败,出现了Exception in thread "main" java.lang.ClassCastException

注意

我正在针对Java的Windows7上运行ANTLR 4.7.2

代码

我创建了一组文件,这些文件与我要实现的目标非常相似。以下示例定义了一种称为MyLang的语言,并分离了词法分析器和解析器语法。另外,我将词法分析器规则分为四个文件:

  1. // MyLang.g4
    parser grammar MyLang;
    
    options { tokenVocab = MyLangL; }
    
    prog
        : ( func )* END
        ;
    
    func
        : DIR ID L_BRKT  (stat)* R_BRKT
        ;
    
    stat
        : expr SEMICOLON
        | ID OP_ASSIGN expr SEMICOLON
        | SEMICOLON
        ;
    
    expr
        : expr OPERATOR expr
        | NUMBER
        | ID
        | L_PAREN expr R_PAREN
        ;
    
  2. // MyLangL.g4
    lexer grammar MyLangL;
    
    import SkipWhitespaceL, CommonL, KeywordL;
    
    @header {
    package com.invensense.wiggler.lexer;
    }
    
    @lexer::members {   // place this class member only in lexer
    Map<String,Integer> keywords = new HashMap<String,Integer>() {{
        put("for",          MyLangL.KW_FOR);
        /* add more keywords here */
    }};
    }
    
    ID  :   [a-zA-Z]+
            {
            if ( keywords.containsKey(getText()) ) {
                setType(keywords.get(getText())); // reset token type
            }
            }
        ;
    
    DIR
        : 'in'
        | 'out'
        ;
    
    END : 'end' ;
    
  3. // KeywordL.g4
    lexer grammar KeywordL;
    
    @lexer::header {    // place this header action only in lexer, not the parser
    import java.util.*;
    }
    
    // explicitly define keyword token types to avoid implicit def warnings
    tokens {
        KW_FOR
        /* add more keywords here */
    }
    
  4. // CommonL.g4
    lexer grammar CommonL;
    
    NUMBER
        : FLOAT
        | INT
        | UINT
        ;
    
    FLOAT
        : NEG? DIGIT+ '.' DIGIT+ EXP?
        | INT
        ;
    
    INT
        : NEG? UINT+
        ;
    
    UINT
        : DIGIT+ EXP?
        ;
    
    OPERATOR
        : OP_ASSIGN
        | OP_ADD
        | OP_SUB
        ;
    
    OP_ASSIGN   : ':=';
    OP_ADD      : POS;
    OP_SUB      : NEG;
    
    L_BRKT          : '[' ;
    R_BRKT          : ']' ;
    L_PAREN         : '(' ;
    R_PAREN         : ')' ;
    SEMICOLON       : ';' ;
    
    fragment EXP
        : [Ee] SIGN? DIGIT+
        ;
    
    fragment SIGN
        : POS
        | NEG
        ;
    
    fragment POS: '+' ;
    fragment NEG : '-' ;
    fragment DIGIT : [0-9];
    
  5. // SkipWhitespaceL.g4
    lexer grammar SkipWhitespaceL;
    
    WS
        :   [ \t\r\n]+ -> channel(HIDDEN)
        ;
    

输出

这是我从上面的代码中收到的确切输出:

ussjc-dd9vkc2 | C:\M\w\s\a\l\example
§ antlr4.bat .\MyLangL.g4

ussjc-dd9vkc2 | C:\M\w\s\a\l\example
§ antlr4.bat .\MyLang.g4

ussjc-dd9vkc2 | C:\M\w\s\a\l\example
§ javac *.java

ussjc-dd9vkc2 | C:\M\w\s\a\l\example
§ grun MyLang prog -tree
Exception in thread "main" java.lang.ClassCastException: class MyLang
        at java.lang.Class.asSubclass(Unknown Source)
        at org.antlr.v4.gui.TestRig.process(TestRig.java:135)
        at org.antlr.v4.gui.TestRig.main(TestRig.java:119)

ussjc-dd9vkc2 | C:\M\w\s\a\l\example
§

1 个答案:

答案 0 :(得分:0)

我有同样的问题。您可以尝试以下操作:删除解析器单词并替换

options {tokenVocab = MyLangL;}

使用

import MyLangL;

应该,但这不是最终解决方案。