如何编写textx语法规则以检测标准数据类型而不修改它们?

时间:2019-04-26 07:32:48

标签: python dsl textx

我想编写一个textx语法规则,它可以包含另一个定义的规则或任何类型的标准数据类型(Int,Float,String等)。

这是针对简单的textx DSL,它应该包括编写(并最终翻译)条件的可能性,该条件可以由其他语法规则(如预定义函数)或任何类型的标准预定义数据类型(字符串/ Int / Float / Bool / ID)。

所以,我实际上希望能够编写类似的内容

condition insert input data 5 equal 10 BEGIN
    ...
END

这代表正常的IF。 insert input data 5是一条规则,稍后会转换为常规函数调用insertOutputData(5)。我在那里使用的语法:

Model: commands*=Command;
Command: Function | Branch;
Function: Func_InsertInputData | Func_InsertOutputData;
Func_InsertInputData: 'insert input data' index=INT;
Func_InsertOutputData: 'insert output data' index=INT;
Branch: 'condition' condition=Condition 'BEGIN'
    commands*=Command;
'END'
Condition: Cond_Equal | Cond_And | Cond_False;
Cond_Equal: op1=Operand 'equal' op2=Operand;
Cond_And: op1=Operand 'and' op2=Operand;
Cond_False: op1=Operand 'is false';
Operand: Function | OR_ANY_OTHER_KIND_OF_DATA;

在解释器中,我尝试通过执行以下操作读取代码:

def translateCommands(cmds):
    commands = []
    for cmd in cmds:
        commands.append(translateCommand(cmd))
    return commands

def translateCommand(cmd):
    print(cmd)
    print(cmd.__class__)
    if cmd.__class__.__name__ == 'int' or cmd.__class__.__name__ == 'float':
        return str(cmd)
    elif cmd.__class__.__name__ == 'str':
        return '\'' + cmd + '\''
    elif(cmd.__class__.__name__ == 'Branch'):
        s = ''
        if(cmd.condition.__class__.__name__ ==  'Cond_Equal'):
            s = 'if ' + translateCommand(cmd.condition.op1) + '==' + translateCommand(cmd.condition.op2) + ':'
        if(cmd.condition.__class__.__name__ == 'Cond_And'):
            s = 'if ' + translateCommand(cmd.condition.op1) + 'and' + translateCommand(cmd.condition.op2) + ':'
        # ...
        commandsInBlock = translateCommands(cmd.commands)
        for command in commandsInBlock:
            s += '\n    '+command
        return s

OR ANY OTHER KIND OF DATA,我尝试列出了实际的数据类型,但这是行不通的。 如果我以Function | FLOAT | INT | BOOL | ID | STRING作为操作数规则使用上面显示的DSL代码处理模型,则整数(示例中等于等号后的10)将转换为浮点数

if insertInputData(5)==10.0:

如果我使用Function | INT | FLOAT | BOOL | ID | STRING这样的Operand规则处理模型,则会收到错误消息

textx.exceptions.TextXSyntaxError: None:13:43: error: Expected 'BEGIN' at position (13, 43) => 't equal 10*.0 BEGIN  '.

我希望看到的结果是

if insertInputData(5)==10:

if insertInputData(5)==10.0:

使用

condition insert input data 5 equal 10.0 BEGIN
    ...
END

但是textx似乎总是尝试将在该位置获得的值转换为Operand规则中建议的类型,这种情况下很糟糕。 我该如何修改规则,以便在不进行任何修改的情况下适当地检测每种数据类型?

编辑1

伊戈尔·德亚诺维奇(IgorDejanović)刚刚描述了这个问题,我遵循了他给出的方法。

语法(相关部分):

Command: Function | Branch | MyNumber;
#...
Oparand: Function | MyNumber | BOOL | ID | STRING;
MyNumber: STRICTFLOAT | INT;
STRICTFLOAT: /[+-]?(((\d+\.(\d*)?|\.\d+)([eE][+-]?\d+)?)|((\d+)([eE][+-]?\d+)))(?<=[\w\.])(?![\w\.])/;

代码:

mm = metamodel_from_str(grammar)
mm.register_obj_processors({'STRICTFLOAT': lambda x: float(x)})

dsl_code = '''
10
10.5
'''
model = mm.model_from_str(dsl_code)
commands = iterateThroughCommands(model.commands)

这导致

10
<class 'int'>

'10.5'
<class 'str'>

因此,缺少一些使对象处理器正常工作的东西...

1 个答案:

答案 0 :(得分:1)

问题在于,每个有效整数都可以解释为<script src="https://cdnjs.cloudflare.com/ajax/libs/lodash.js/4.17.11/lodash.min.js"></script>,因此,如果将规则按FLOAT进行排序,则会得到FLOAT | INT |...类型,因为float规则将匹配但是如果您以浮点数的FLOAT顺序订购规则,则解析器将消耗部分数字,直到INT | FLOAT|...为止,然后解析将不会继续。

这在textX的开发版本中得到解决(请参见CHANGELOG.md),方法是引入.规则,该规则永远不会匹配整数,并且内置STRICTFLOAT规则已更改为首次尝试先匹配NUMBER,然后匹配STRICTFLOAT

下一个版本将是INT,我希望在接下来的几周内发布。同时,您可以直接从github安装,也可以修改语法以具有以下内容:

2.0.0

并为您的MyNumber: STRICTFLOAT | INT; STRICTFLOAT: /[+-]?(((\d+\.(\d*)?|\.\d+)([eE][+-]?\d+)?)|((\d+)([eE][+-]?\d+)))(?<=[\w\.])(?![\w\.])/; // or the float format you prefer 类型注册object processor,该类型将转换为Python STRICTFLOAT。升级到textX 2.0.0后,您只需在语法中将对float的引用替换为MyNumber

更多信息可以在the reported issue

中找到

编辑1:

由于报告了here的错误,建议的解决方案目前无法正常工作。

编辑2:

该错误已在开发版本中修复。在2.0.0版本发布之前,您必须

NUMBER

然后,如果您不想更改默认类型,则根本不需要解决方法。