所以我一直在研究和试验几个月的语言设计,我比几个月前的理解要好得多。我仍然对一些事情感到困惑...... 我没有研究就砍掉了一些糟糕的解析器,但我需要更好的东西。 所以我正在尝试编写一个递归下降解析器,因为我已经读过它是手工编写的最合理的解析器。据我所知,每个规则都实现在它自己的功能中。所以我想我理解我将如何写这些但只有前半部分...解析器的工作是创建一个语法树或类似的东西,对吗?我也一直在尝试研究这个主题,但我还没有找到任何关于如何用语言表示树的例子。我正在写D,因为它是我最喜欢的语言,但它与C / C ++非常相似,所以我将理解用这些语言或伪代码编写的任何示例。
在我看到的内容中,有大量的类从彼此继承,因此可能存在一个语句类,其中IfStatement类扩展为例如。但是我无法找到所有这些在树中的表现方式,甚至是如何在以后的方式中表现出来。
如果有人能够向我展示一个例子或者更深入地谈论这些事情,那将是太棒了。任何帮助真的意味着很多,并有助于我的好奇心和目标,提前感谢!
答案 0 :(得分:9)
树通常表示为包含指向其子节点的结构,并且它具有存储其节点类型的node
成员,或者它具有某个类,以便您可以派生其实际类型(即如果它包含算术表达式,if语句,循环等。)。
正如您所提到的,一个简单的例子确实是if
语句。为此,你会做这样的事情(伪C跟随):
enum AST_Node {
Node_if,
Node_and,
Node_or,
Node_not,
Node_equal,
Node_less,
// etc., other node types follow
};
struct AST {
struct AST *children[MAX_CHILDREN]; // don't do this
enum AST_Node node;
};
struct AST *parse_if_statement()
{
// expect tokens in order
expect("if");
// parse condition
expect("(");
struct AST *condition = parse_expression();
expect(")");
// parse two child statements
struct AST *then_branch = parse_statement();
struct AST *else_branch = NULL;
if (accept("else")) {
else_branch = parse_statement();
}
// create AST, fill in children
struct AST *if_statement = new_AST_node(Node_if);
if_statement->children[0] = condition;
if_statement->children[1] = then_branch;
if_statement->children[2] = else_branch;
return if_statement;
}
所以基本上你只是期望/接受永久词汇元素(“if”,条件周围的括号等),然后你将子树(条件和两个分支)的解析交给适当的解析器函数。
这就是你走树的方式:你基本上做了一个深度优先的步行,按顺序编译或解释每个孩子。然后添加当前正在解释/编译的子树的节点类型暗示的额外语义。
Value *interpret_if_statement(struct AST *ast)
{
assert(ast->node == Node_if);
struct AST *condition = ast->children[0];
struct AST *then_branch = ast->children[1];
struct AST *else_branch = ast->children[2];
// evaluate condition
Value *condval = interpret_expression(condition);
if (condval->bool_value == TRUE) {
// if condition is true, interpret "then" branch
return interpret_statement(then_branch);
} else if (else_branch != NULL) {
// otherwise interpret "else" branch, if any
return interpret_statement(else_branch);
} else {
return NULL;
}
}