解析Clang AST - 缩进级别和起始符号

时间:2015-01-23 21:08:00

标签: c++ parsing clang

我必须手工解析Clang AST,但是我在理解描述节点之间链接的缩进规则时遇到了一些麻烦。我们举一个简单的例子。对于以下代码,

int f(int x) {
  int result = (x / 42);
  return result;
}

生成的AST是

... cutting out internal declarations of clang ...
`-FunctionDecl 0x5aeab50 <test.cc:1:1, line:4:1> f 'int (int)'
  |-ParmVarDecl 0x5aeaa90 <line:1:7, col:11> x 'int'
  `-CompoundStmt 0x5aead88 <col:14, line:4:1>
    |-DeclStmt 0x5aead10 <line:2:3, col:24>
    | `-VarDecl 0x5aeac10 <col:3, col:23> result 'int'
    |   `-ParenExpr 0x5aeacf0 <col:16, col:23> 'int'
    |     `-BinaryOperator 0x5aeacc8 <col:17, col:21> 'int' '/'
    |       |-ImplicitCastExpr 0x5aeacb0 <col:17> 'int' <LValueToRValue>
    |       | `-DeclRefExpr 0x5aeac68 <col:17> 'int' lvalue ParmVar 0x5aeaa90 'x' 'int'
    |       `-IntegerLiteral 0x5aeac90 <col:21> 'int' 42
    `-ReturnStmt 0x5aead68 <line:3:3, col:10>
      `-ImplicitCastExpr 0x5aead50 <col:10> 'int' <LValueToRValue>
        `-DeclRefExpr 0x5aead28 <col:10> 'int' lvalue Var 0x5aeac10 'result' 'int'

注意:为了避免引号符号格式化问题,我会将其替换为\

  • 我们真的不明白何时我们可以告诉两个节点有相同的父节点。我很明白这取决于身份等级,但是例如第三行以\-开头,所以我猜\表示CompoundStmtParmVarDecl的孩子。然而,缩进级别是相同的。

  • 第4行,DeclStmt比上一行缩进得更多,但没有\符号,因此它被视为CompoundStmt或其子项的子节点?

  • 最后,在DeclStmt中,我们有越来越多以\-开头的缩进行,这与第3行之间有什么区别(从\-开始,但是具有与前一行相同的缩进级别)?

有人能解释一下这个起始符号和缩进级别的语义吗?

1 个答案:

答案 0 :(得分:3)

将unicode U + 2514 Box图纸点亮并向右替换它们的角符号(它们将自己限制为ASCII),你会看到它更好:

... cutting out internal declarations of clang ...
└─FunctionDecl 0x5aeab50 <test.cc:1:1, line:4:1> f 'int (int)'
  ├─ParmVarDecl 0x5aeaa90 <line:1:7, col:11> x 'int'
  └─CompoundStmt 0x5aead88 <col:14, line:4:1>
    ├─DeclStmt 0x5aead10 <line:2:3, col:24>
    │ └─VarDecl 0x5aeac10 <col:3, col:23> result 'int'
    │   └─ParenExpr 0x5aeacf0 <col:16, col:23> 'int'
    │     └─BinaryOperator 0x5aeacc8 <col:17, col:21> 'int' '/'
    │       ├─ImplicitCastExpr 0x5aeacb0 <col:17> 'int' <LValueToRValue>
    │       │ └─DeclRefExpr 0x5aeac68 <col:17> 'int' lvalue ParmVar 0x5aeaa90 'x' 'int'
    │       └─IntegerLiteral 0x5aeac90 <col:21> 'int' 42
    └─ReturnStmt 0x5aead68 <line:3:3, col:10>
      └─ImplicitCastExpr 0x5aead50 <col:10> 'int' <LValueToRValue>
        └─DeclRefExpr 0x5aead28 <col:10> 'int' lvalue Var 0x5aeac10 'result' 'int'

使用了更多的盒子绘图字符来美化线条...