ANTLR4简单语法不匹配

时间:2014-08-19 07:41:15

标签: c# antlr grammar antlr4

我使用最新版本的Antlr(4.3)来解析这个简单的源文件。我使用的是Visual Studio加载项,但这不应该与我的问题有任何关系。

源文件:

OBJECT Codeunit 80 Sales-Post
{
  OBJECT-PROPERTIES
  {
    Date=11/12/10;
    Time=12:00:00;
    Version List=NAVW16.00.10,NAVBE6.00.01;
  }
}

解析时应该非常简单,但在解析时我会遇到2个错误:

line 1:16 mismatched input '80' expecting DOCUMENT_ID
line 5:4 mismatched input 'Date' expecting {DOCUMENT_PROPERTY_ID, '}'}

完整的语法:

grammar Cal;

/*
 * Parser Rules
 */
document
    : document_header OPEN_BRACE document_content CLOSE_BRACE
    ;

document_header
    : OBJECT_DEFINITION DOCUMENT_TYPE DOCUMENT_ID DOCUMENT_NAME
    ;

document_content
    : document_properties
    ;

document_properties
    : OBJECT_PROPERTIES OPEN_BRACE document_property* CLOSE_BRACE
    ;

document_property
    : DOCUMENT_PROPERTY_ID EQ DOCUMENT_PROPERTY_VALUE LINE_TERM
    ;


/*
 * Lexer Rules
 */
OBJECT_PROPERTIES
    : 'OBJECT-PROPERTIES'
    ;

OBJECT_DEFINITION
    : 'OBJECT'
    ;

DOCUMENT_TYPE
    : 'Codeunit'
    | 'Table'
    ;

DOCUMENT_PROPERTY_VALUE
    : ([0-9a-zA-Z]|'_'|'-'|'.'|'/'|','|':')+
    ;

DOCUMENT_PROPERTY_ID
    : 'Date'
    | 'Time'
    | 'Version List'
    ;

DOCUMENT_ID
    : [0-9]+
    ;

DOCUMENT_NAME
    : ID
    ;

OPEN_BRACE
    : '{'
    ;

CLOSE_BRACE
    : '}'
    ;

LINE_TERM
    : ';'
    ;

EQ
    : '='
    ;

ID
    : ([a-zA-Z]|'_'|'-')+
    ;

INT
    : [0-9]+
    ;

WS
    : [ \t]+ -> channel(HIDDEN)
    ;

NEWLINE
    :'\r'? '\n' -> channel(HIDDEN)
    ;

这是令牌流的输出(令牌周围有'<>':

<OBJECT> < > <Codeunit> < > <80> < > <Sales-Post> <
> <{> <
> <  > <OBJECT-PROPERTIES> <
> <  > <{> <
> <    > <Date> <=> <11/12/10> <;> <
> <    > <Time> <=> <12:00:00> <;> <
> <    > <Version List> <=> <NAVW16.00.10,NAVBE6.00.01> <;> <
> <  > <}> <
> <}> <<EOF>

1 个答案:

答案 0 :(得分:1)

在ANTLR中,当两个词法分析器规则可以匹配相同的令牌(长度相同)时,首先出现的规则会获胜。

80可由DOCUMENT_ID匹配,也可由DOCUMENT_PROPERTY_VALUEINT匹配,因此请在此处重新排序这些规则。

DOCUMENT_PROPERTY_ID DOCUMENT_PROPERTY_VALUE低于Date(两者都匹配DOCUMENT_PROPERTY_VALUE),您遇到同样的问题。

我建议你将WS放在DOCUMENT_ID之上:大多数特定规则(即关键字)排在第一位,更广泛的规则会持续存在。

您还必须摆脱INTINT,因为它们具有相同的定义。其中一个永远不会匹配。您似乎没有在解析器中使用{{1}},因此只需删除规则。