是否有用于解析基于字符串的复杂查询的库或规范

时间:2019-01-16 22:30:55

标签: python parsing specifications text-parsing

已经看到一些REST API的非常常见的模式,用于通过传递组合字符串来处理过滤

一个这样的例子:https://www.algolia.com/doc/api-reference/api-parameters/filters/?language=python#examples

示例available = 1 AND (category:Book OR NOT category:Ebook) AND _tags:published AND publication_date:1441745506 TO 1441755506 AND inStock > 0 AND author:"John Doe"

是否有一个很好的规范或解析库来处理诸如此类的事情,可以采用这样的字符串并将其解析为可以映射到查询的结构?

1 个答案:

答案 0 :(得分:1)

使用任何不错的常规解析库,您都可以构建一个解析器来解析这种语言。由于这是一种表达语言,我建议您使用一些自下而上的算法,该算法具有声明性的关联性和优先级规范。

例如,在parglare中(披露:我是作者),它将类似于:

from parglare import Grammar, Parser

grammar = r'''
S: E EOF;
E: Term | And | Not | Or | To | Parent;
And: left=E 'AND' right=E;
Or: left=E 'OR' right=E;
Not: 'NOT' val=E;
To: from=E 'TO' to=BASETYPE;
Parent: '(' E ')' {9};
Term: name=ID TermOp value=BASETYPE {10};
TermOp: ':' | '=' | '>' | '<' | '<=' | '>=';
BASETYPE: NUM | STRING | ID;

terminals
NUM: /\d+(\.\d+)?/;
ID: /[a-zA-Z_][_a-zA-Z0-9]*/;
STRING: /("(\\"|[^"])*")|(\'(\\\'|[^\'])*\')/;
'''

g = Grammar.from_string(grammar)
parser = Parser(g)

out = parser.parse(r'''
available = 1 AND (category:Book OR NOT category:Ebook)
     AND _tags:published
     AND publication_date:1441745506 TO 1441755506
     AND inStock > 0 AND author:"John Doe"
''')

最后的

out引用将是一个很好的对象模型,它是从上面的语法推导出来的。您可以在调试器中对其进行研究以获得感觉。我不了解全部语言,因为我不知道,但您明白了。

现在扩展该示例以支持完整的语言,并使给定结构的映射程序与查询相对容易。

如果使用parglare动作将已解析的输入直接转换为所需的输出,则将更加简单。您可以在the docs中详细了解它。