Question

我遇到过一种专有的基于堆栈的脚本语言，它看起来像是x86 ASM的简化版本。

我在C ++中为这种语言构建了一个基于堆栈的线性解析器，我希望它能生成伪C代码，使语言更容易阅读。

我遇到了至少一个严重的问题，我觉得这与我的解析器的线性特性有关...例如，假设我们有以下代码：

push const int
push const str
call some_method
pop const str
pop const int
return last return val

通过我当前的实现，我可以很容易地生成以下内容：

retval = some_method(str, int)
return retval

但以下将是一个重大的痛苦：

return some_method(some_str, some_int)

当我遇到指令/操作码时，我会发现-variables-被推入堆栈，但这就是它......

它归结为我可以从postfix转到中缀以获得类似指令的组合（例如推+调用），但不能用于多个指令。

对于语言分析器，我非常缺乏经验，所以对我来说很容易！你的建议是什么？

Answer 1

你想要的是symbolic execution。安排表达式的C ++表示，例如

class Expression{...};
class StringConstant:public Expression{...};
class FunctionCall:public Expression{...};

然后，使符号堆栈包含Expression*。当你到达

return foo

将此编译为

cout<<"return "; foo_expr->print();

其中每个Expression都有一个合适的（可能是递归的）打印方法。

编辑：如果没有return语句，则需要遍历值堆栈，并对所有尚未使用的值执行 - ＆gt; print。