我使用最新版本的Antlr(4.3)来解析这个简单的源文件。我使用的是Visual Studio加载项,但这不应该与我的问题有任何关系。
源文件:
OBJECT Codeunit 80 Sales-Post
{
OBJECT-PROPERTIES
{
Date=11/12/10;
Time=12:00:00;
Version List=NAVW16.00.10,NAVBE6.00.01;
}
}
解析时应该非常简单,但在解析时我会遇到2个错误:
line 1:16 mismatched input '80' expecting DOCUMENT_ID
line 5:4 mismatched input 'Date' expecting {DOCUMENT_PROPERTY_ID, '}'}
完整的语法:
grammar Cal;
/*
* Parser Rules
*/
document
: document_header OPEN_BRACE document_content CLOSE_BRACE
;
document_header
: OBJECT_DEFINITION DOCUMENT_TYPE DOCUMENT_ID DOCUMENT_NAME
;
document_content
: document_properties
;
document_properties
: OBJECT_PROPERTIES OPEN_BRACE document_property* CLOSE_BRACE
;
document_property
: DOCUMENT_PROPERTY_ID EQ DOCUMENT_PROPERTY_VALUE LINE_TERM
;
/*
* Lexer Rules
*/
OBJECT_PROPERTIES
: 'OBJECT-PROPERTIES'
;
OBJECT_DEFINITION
: 'OBJECT'
;
DOCUMENT_TYPE
: 'Codeunit'
| 'Table'
;
DOCUMENT_PROPERTY_VALUE
: ([0-9a-zA-Z]|'_'|'-'|'.'|'/'|','|':')+
;
DOCUMENT_PROPERTY_ID
: 'Date'
| 'Time'
| 'Version List'
;
DOCUMENT_ID
: [0-9]+
;
DOCUMENT_NAME
: ID
;
OPEN_BRACE
: '{'
;
CLOSE_BRACE
: '}'
;
LINE_TERM
: ';'
;
EQ
: '='
;
ID
: ([a-zA-Z]|'_'|'-')+
;
INT
: [0-9]+
;
WS
: [ \t]+ -> channel(HIDDEN)
;
NEWLINE
:'\r'? '\n' -> channel(HIDDEN)
;
这是令牌流的输出(令牌周围有'<>':
<OBJECT> < > <Codeunit> < > <80> < > <Sales-Post> <
> <{> <
> < > <OBJECT-PROPERTIES> <
> < > <{> <
> < > <Date> <=> <11/12/10> <;> <
> < > <Time> <=> <12:00:00> <;> <
> < > <Version List> <=> <NAVW16.00.10,NAVBE6.00.01> <;> <
> < > <}> <
> <}> <<EOF>
答案 0 :(得分:1)
在ANTLR中,当两个词法分析器规则可以匹配相同的令牌(长度相同)时,首先出现的规则会获胜。
80
可由DOCUMENT_ID
匹配,也可由DOCUMENT_PROPERTY_VALUE
和INT
匹配,因此请在此处重新排序这些规则。
DOCUMENT_PROPERTY_ID
DOCUMENT_PROPERTY_VALUE
低于Date
(两者都匹配DOCUMENT_PROPERTY_VALUE
),您遇到同样的问题。
我建议你将WS
放在DOCUMENT_ID
之上:大多数特定规则(即关键字)排在第一位,更广泛的规则会持续存在。
您还必须摆脱INT
或INT
,因为它们具有相同的定义。其中一个永远不会匹配。您似乎没有在解析器中使用{{1}},因此只需删除规则。