关于postfix-to-infix解析器的建议

时间:2011-02-06 18:20:13

标签: c++ parsing language-design

我遇到过一种专有的基于堆栈的脚本语言,它看起来像是x86 ASM的简化版本。

我在C ++中为这种语言构建了一个基于堆栈的线性解析器,我希望它能生成伪C代码,使语言更容易阅读。

我遇到了至少一个严重的问题,我觉得这与我的解析器的线性特性有关...例如,假设我们有以下代码:

push const int
push const str
call some_method
pop const str
pop const int
return last return val

通过我当前的实现,我可以很容易地生成以下内容:

retval = some_method(str, int)
return retval

但以下将是一个重大的痛苦:

return some_method(some_str, some_int)

当我遇到指令/操作码时,我会发现-variables-被推入堆栈,但这就是它......

它归结为我可以从postfix转到中缀以获得类似指令的组合(例如推+调用),但不能用于多个指令。

对于语言分析器,我非常缺乏经验,所以对我来说很容易!你的建议是什么?

1 个答案:

答案 0 :(得分:2)

你想要的是symbolic execution。安排表达式的C ++表示,例如

class Expression{...};
class StringConstant:public Expression{...};
class FunctionCall:public Expression{...};

然后,使符号堆栈包含Expression*。当你到达

return foo

将此编译为

cout<<"return "; foo_expr->print();

其中每个Expression都有一个合适的(可能是递归的)打印方法。

编辑:如果没有return语句,则需要遍历值堆栈,并对所有尚未使用的值执行 - &gt; print。