解析:: RecDescent和带引号的运算符

时间:2019-04-04 02:37:11

标签: perl parse-recdescent

我有如下内容:

((x=2 or y=3 ) and (r=3 and c=3) or (x=5 and g=6))

我定义了:

Token : /\w \= \d/
operator or|and
expression : token operator(s)
quoted_expression : "("expression")"
query : expression (s)|quoted_expression(s)

但是我对解析以上条件有任何想法,如何解析以上内容?

1 个答案:

答案 0 :(得分:3)

核心是您想要的

expr    : log_or

log_or  : log_or 'or' log_and
        | log_and

log_and : log_and 'and' cmp
        | cmp

cmp     : cmp /=|<[>=]?|>=?/ term
        | term

term    : '(' expr ')'
        | IDENT
        | NUMBER

eliminating left-recursion并添加必要的代码块之后,您将获得以下内容:

my $grammar = <<'__EOS__';

   {
      # The code in rules is also covered by these pragmas.
      use strict;
      use warnings;
   }

   parse    : expr /\Z/ { $item[1] }

   # ----------------------------------------
   # Rules

   expr     : log_or { $item[1] }

   # ---vvv--- Lowest precedence ---vvv---

   log_or   : log_and log_or_[ $item[1] ]
   log_or_  : 'or' log_and log_or_[ [ $item[1], $arg[0], $item[2] ] ]
            | { $arg[0] }

   log_and  : cmp log_and_[ $item[1] ]
   log_and_ : 'and' cmp log_and_[ [ $item[1], $arg[0], $item[2] ] ]
            | { $arg[0] }

   cmp      : term cmp_[ $item[1] ]
   cmp_     : /=|<[>=]?|>=?/ term cmp_[ [ $item[1], $arg[0], $item[2] ] ]
            | { $arg[0] }

   # ---^^^--- Highest precedence ---^^^---

   term     : '(' expr ')' { $item[2] }
            | IDENT  { [ $item[0], $item[1] ] }
            | NUMBER { [ $item[0], $item[1] ] }

   # ----------------------------------------
   # Tokens

   IDENT    : /\w+/
   NUMBER   : /\d+/

__EOS__