Python:解析文本文件并显示为图形

时间:2011-05-03 08:47:58

标签: python parsing graph

我有这种格式的文本文件:

   BFrame.make()
      Frame.make_bbox()
         BBox.__init__(arg1=x, arg2=y, arg3=z)
         : None
         BBox.make()
           BBox.chk_pre()
           : None
         : (1,1,2,2)
      : None
      ExConfig.__init__(filename=None)
        ExConfig.setParam()
            ExConfig.setfromKey(AUTO=[0.0, 0.0])
                 ExConfig.setFromList([('PHOT', [2.5, 3.5]), ('BV', [0.0, 0.0])])
                 : None
            : None
        : [returns a list of paramaters]
        ExConfig.getKwList()
            : [('A_THR', 3.0), ('B_THICK', 24),]
      : None
    etc..
   :Frame

您在上面看到的是一个调用层次结构。

缩进显示已调用或正在调用的方法。

以“:”开头的所有行都显示方法的返回值。

我的问题是如何解析文本文件并将其表示为调用层次结构树,其中每个节点都是一个调用的方法。我们将属性附加到每个节点,这些节点是传递给该方法的参数。

2 个答案:

答案 0 :(得分:1)

看起来你需要一个真正的解析器,因为这不是一个简单的格式。

存在许多用Python编写解析器的方法。例如,请参阅PLY。另一个是PyParsing

或者,也许你真正需要Python Call Graph

答案 1 :(得分:1)

以下是我对此的看法:

a = """BFrame.make()
      Frame.make_bbox()
         BBox.__init__(arg1=x, arg2=y, arg3=z)
         : None
         BBox.make()
           BBox.chk_pre()
           : None
         : (1,1,2,2)
      : None
      ExConfig.__init__(filename=None)
        ExConfig.setParam()
            ExConfig.setfromKey(AUTO=[0.0, 0.0])
                 ExConfig.setFromList([('PHOT', [2.5, 3.5]), ('BV', [0.0, 0.0])])
                 : None
            : None
        : [returns a list of paramaters]
        ExConfig.getKwList()
            : [('A_THR', 3.0), ('B_THICK', 24),]
      : None
   :Frame"""

b = [ line.strip() for line in a.split("\n") ]

stck1 = []
stck2 = []

while b:
    add_v = b.pop(0)
    if add_v[0] != ':':
        stck1.append(add_v)
    else:
        if stck2:
            mx = max([x[0] for x in stck2])
        else:
            mx = 0
        if len(stck1) < mx:
            calls = []
            while stck2 and stck2[-1][0] == mx:            
                calls.append(stck2.pop())
            stck2.append([len(stck1), stck1.pop(), add_v, calls[::-1]])
        else:
            stck2.append([len(stck1), stck1.pop(), add_v])

给你这个:

>>> pprint.pprint(stck2, width=5)
[[1,
  'BFrame.make()',
  ':Frame',
  [[2,
    'Frame.make_bbox()',
    ': None',
    [[3,
      'BBox.__init__(arg1=x, arg2=y, arg3=z)',
      ': None'],
     [3,
      'BBox.make()',
      ': (1,1,2,2)',
      [[4,
        'BBox.chk_pre()',
        ': None']]]]],
   [2,
    'ExConfig.__init__(filename=None)',
    ': None',
    [[3,
      'ExConfig.setParam()',
      ': [returns a list of paramaters]',
      [[4,
        'ExConfig.setfromKey(AUTO=[0.0, 0.0])',
        ': None',
        [[5,
          "ExConfig.setFromList([('PHOT', [2.5, 3.5]), ('BV', [0.0, 0.0])])",
          ': None']]]]],
     [3,
      'ExConfig.getKwList()',
      ": [('A_THR', 3.0), ('B_THICK', 24),]"]]]]]]
>>> 

嵌套[ hierarchy_level, call, result, children_calls ],其中儿童的结构与其父母的结构相同。

格式化的一种方法:

>>> def pretty(X):
...     if len(X)==4:
...         print '\t'*X[0], X[1], 'returns', X[2]
...         print '\t'*X[0], 'children:'
...         for child in X[3]:
...             pretty(child)
...     else:
...         print '\t'*X[0], X[1], 'returns', X[2]
...         print '\t'*X[0], 'no children'
... 
>>> pretty(stck2[0])
    BFrame.make() returns :Frame
    children:
        Frame.make_bbox() returns : None
        children:
            BBox.__init__(arg1=x, arg2=y, arg3=z) returns : None
            no children
            BBox.make() returns : (1,1,2,2)
            children:
                BBox.chk_pre() returns : None
                no children
        ExConfig.__init__(filename=None) returns : None
        children:
            ExConfig.setParam() returns : [returns a list of paramaters]
            children:
                ExConfig.setfromKey(AUTO=[0.0, 0.0]) returns : None
                children:
                    ExConfig.setFromList([('PHOT', [2.5, 3.5]), ('BV', [0.0, 0.0])]) returns : None
                    no children
            ExConfig.getKwList() returns : [('A_THR', 3.0), ('B_THICK', 24),]
            no children
>>>