简单演示了递归使用pyparsing的indentedBlock

时间:2013-03-14 19:23:29

标签: python pyparsing

我正在尝试在pyparsing中使用indentedBlock(这对我来说很棒)来剖析一些嵌套的缩进,但是在理解API引用中的描述(或{{下的更具体的示例)时我正在努力3}}或http://pyparsing.wikispaces.com中的提及)。

有人可以指点我简要演示或解释如何递归使用indentedBlock,或者在这里提供一个吗?例如,我们如何转换YAMLish之类的东西......

- a1_el
    - b1_el
        x1_attr: 1
        x2_attr: 2
    - b2_el
        - c1_el # I am a comment
    - b3_el
        x1_attr: 1 

...进入某些XML表示,例如......

<a1_el>
    <b1_el x1_attr="1" x2_attr="2"/>
    <b2_el>
        <c1_el/><!-- I am a comment -->
    </b2_el>
    <b3_el x1_attr="1"/>
</a1_el>

...与indentedBlock? (另外:在实际情况下,我需要indentStack参数的不同otpions吗?)。非常感谢!

1 个答案:

答案 0 :(得分:6)

这有点旧,但这是一个部分答案:

from pyparsing import *

COMMENT   = pythonStyleComment
OPCOMMENT = Optional(COMMENT)
IDENT     = Word(alphas, alphanums + '_')

attribute    = IDENT + Suppress(':') + Word(alphanums) + OPCOMMENT
element      = Suppress('-') + IDENT + OPCOMMENT
elementBlock = Forward()
blockContent = attribute|elementBlock|COMMENT
elementBlock << element + Optional(indentedBlock(blockContent, [1]))

我假设元素可以按任意顺序包含属性和元素。 elementBlock将解析整棵树。

它展示了indentedBlock的使用,因此,为了简化它,它不允许树外的注释,它只接受一个根元素(对于XML来说不是问题......)< / p>

关于indentStack:它保留当前缩进级别数的列表,列表的最后一个元素显示当前缩进列。正如文档所指出的那样,使用缩进的嵌套块的语法上的所有语句都应该共享相同的列表。由于只有一个,我只是在调用indentedBlock时直接创建了它。

我将结果转换为XML作为读者的练习:-P