我遇到过一种专有的基于堆栈的脚本语言,它看起来像是x86 ASM的简化版本。
我在C ++中为这种语言构建了一个基于堆栈的线性解析器,我希望它能生成伪C代码,使语言更容易阅读。
我遇到了至少一个严重的问题,我觉得这与我的解析器的线性特性有关...例如,假设我们有以下代码:
push const int
push const str
call some_method
pop const str
pop const int
return last return val
通过我当前的实现,我可以很容易地生成以下内容:
retval = some_method(str, int)
return retval
但以下将是一个重大的痛苦:
return some_method(some_str, some_int)
当我遇到指令/操作码时,我会发现-variables-被推入堆栈,但这就是它......
它归结为我可以从postfix转到中缀以获得类似指令的组合(例如推+调用),但不能用于多个指令。
对于语言分析器,我非常缺乏经验,所以对我来说很容易!你的建议是什么?
答案 0 :(得分:2)
你想要的是symbolic execution。安排表达式的C ++表示,例如
class Expression{...};
class StringConstant:public Expression{...};
class FunctionCall:public Expression{...};
然后,使符号堆栈包含Expression*
。当你到达 p>
return foo
将此编译为
cout<<"return "; foo_expr->print();
其中每个Expression都有一个合适的(可能是递归的)打印方法。
编辑:如果没有return语句,则需要遍历值堆栈,并对所有尚未使用的值执行 - &gt; print。