使用antlr4进行条件解析-跳过输入

时间:2018-08-11 13:29:49

标签: java antlr antlr4

我有一个要使用antlr4解析的字符串,如果在字符串中匹配了特定的输入,我需要跳过一个标记。

例如,字符串包含数字和字符串,如下所示:

String = "87uuujdhhfj12ooiik56iijtg40jhdksa";

解析输出:

87 uuujdhhfj 
12 ooiik56iijtg   //here 56 is skipped
40 jhdksa

如果字符串在解析时匹配12,那么我需要从解析中跳过下12个字符(除12以外的任何值都可以)。

任何对此类型的解析的引用或代码都会有所帮助。

1 个答案:

答案 0 :(得分:0)

在词法分析器中进行处理将需要一个predicate

lexer grammar TLexer;

@members {
  int charsToConsume = 0;
}

TOKEN
 : ( {charsToConsume-- > 0}? [a-zA-Z0-9] )+
 | [a-zA-Z]+
 ;

INT
 : [0-9]+ {
     int n = Integer.parseInt(getText());
     if (n == 12) {
       this.charsToConsume = 12;
     }
   }
 ;

您可以在该类中运行的

import org.antlr.v4.runtime.*;

public class Main {

  public static void main(String[] args) {

    String source = "87uuujdhhfj12ooiik56iijtg40jhdksa";

    TLexer lexer = new TLexer(CharStreams.fromString(source));
    CommonTokenStream tokens = new CommonTokenStream(lexer);

    tokens.fill();

    for (Token t : tokens.getTokens()) {
      System.out.printf("%-15s '%s'\n", TLexer.VOCABULARY.getSymbolicName(t.getType()), t.getText());
    }
  }
}

并打印:

INT             '87'
TOKEN           'uuujdhhfj'
INT             '12'
TOKEN           'ooiik56iijtg'
INT             '40'
TOKEN           'jhdksa'
EOF             '<EOF>'