我必须手工解析Clang AST,但是我在理解描述节点之间链接的缩进规则时遇到了一些麻烦。我们举一个简单的例子。对于以下代码,
int f(int x) {
int result = (x / 42);
return result;
}
生成的AST是
... cutting out internal declarations of clang ...
`-FunctionDecl 0x5aeab50 <test.cc:1:1, line:4:1> f 'int (int)'
|-ParmVarDecl 0x5aeaa90 <line:1:7, col:11> x 'int'
`-CompoundStmt 0x5aead88 <col:14, line:4:1>
|-DeclStmt 0x5aead10 <line:2:3, col:24>
| `-VarDecl 0x5aeac10 <col:3, col:23> result 'int'
| `-ParenExpr 0x5aeacf0 <col:16, col:23> 'int'
| `-BinaryOperator 0x5aeacc8 <col:17, col:21> 'int' '/'
| |-ImplicitCastExpr 0x5aeacb0 <col:17> 'int' <LValueToRValue>
| | `-DeclRefExpr 0x5aeac68 <col:17> 'int' lvalue ParmVar 0x5aeaa90 'x' 'int'
| `-IntegerLiteral 0x5aeac90 <col:21> 'int' 42
`-ReturnStmt 0x5aead68 <line:3:3, col:10>
`-ImplicitCastExpr 0x5aead50 <col:10> 'int' <LValueToRValue>
`-DeclRefExpr 0x5aead28 <col:10> 'int' lvalue Var 0x5aeac10 'result' 'int'
注意:为了避免引号符号格式化问题,我会将其替换为\
我们真的不明白何时我们可以告诉两个节点有相同的父节点。我很明白这取决于身份等级,但是例如第三行以\-
开头,所以我猜\
表示CompoundStmt
是ParmVarDecl
的孩子。然而,缩进级别是相同的。
第4行,DeclStmt
比上一行缩进得更多,但没有\
符号,因此它被视为CompoundStmt
或其子项的子节点?
最后,在DeclStmt
中,我们有越来越多以\-
开头的缩进行,这与第3行之间有什么区别(从\-
开始,但是具有与前一行相同的缩进级别)?
有人能解释一下这个起始符号和缩进级别的语义吗?
答案 0 :(得分:3)
将unicode U + 2514 Box图纸点亮并向右└
替换它们的角符号(它们将自己限制为ASCII),你会看到它更好:
... cutting out internal declarations of clang ...
└─FunctionDecl 0x5aeab50 <test.cc:1:1, line:4:1> f 'int (int)'
├─ParmVarDecl 0x5aeaa90 <line:1:7, col:11> x 'int'
└─CompoundStmt 0x5aead88 <col:14, line:4:1>
├─DeclStmt 0x5aead10 <line:2:3, col:24>
│ └─VarDecl 0x5aeac10 <col:3, col:23> result 'int'
│ └─ParenExpr 0x5aeacf0 <col:16, col:23> 'int'
│ └─BinaryOperator 0x5aeacc8 <col:17, col:21> 'int' '/'
│ ├─ImplicitCastExpr 0x5aeacb0 <col:17> 'int' <LValueToRValue>
│ │ └─DeclRefExpr 0x5aeac68 <col:17> 'int' lvalue ParmVar 0x5aeaa90 'x' 'int'
│ └─IntegerLiteral 0x5aeac90 <col:21> 'int' 42
└─ReturnStmt 0x5aead68 <line:3:3, col:10>
└─ImplicitCastExpr 0x5aead50 <col:10> 'int' <LValueToRValue>
└─DeclRefExpr 0x5aead28 <col:10> 'int' lvalue Var 0x5aeac10 'result' 'int'
使用了更多的盒子绘图字符来美化线条...