我正在尝试在pyparsing中使用indentedBlock
(这对我来说很棒)来剖析一些嵌套的缩进,但是在理解API引用中的描述(或{{下的更具体的示例)时我正在努力3}}或http://pyparsing.wikispaces.com中的提及)。
有人可以指点我简要演示或解释如何递归使用indentedBlock
,或者在这里提供一个吗?例如,我们如何转换YAMLish之类的东西......
- a1_el
- b1_el
x1_attr: 1
x2_attr: 2
- b2_el
- c1_el # I am a comment
- b3_el
x1_attr: 1
...进入某些XML表示,例如......
<a1_el>
<b1_el x1_attr="1" x2_attr="2"/>
<b2_el>
<c1_el/><!-- I am a comment -->
</b2_el>
<b3_el x1_attr="1"/>
</a1_el>
...与indentedBlock
? (另外:在实际情况下,我需要indentStack
参数的不同otpions吗?)。非常感谢!
答案 0 :(得分:6)
这有点旧,但这是一个部分答案:
from pyparsing import *
COMMENT = pythonStyleComment
OPCOMMENT = Optional(COMMENT)
IDENT = Word(alphas, alphanums + '_')
attribute = IDENT + Suppress(':') + Word(alphanums) + OPCOMMENT
element = Suppress('-') + IDENT + OPCOMMENT
elementBlock = Forward()
blockContent = attribute|elementBlock|COMMENT
elementBlock << element + Optional(indentedBlock(blockContent, [1]))
我假设元素可以按任意顺序包含属性和元素。 elementBlock
将解析整棵树。
它展示了indentedBlock
的使用,因此,为了简化它,它不允许树外的注释,它只接受一个根元素(对于XML来说不是问题......)< / p>
关于indentStack
:它保留当前缩进级别数的列表,列表的最后一个元素显示当前缩进列。正如文档所指出的那样,使用缩进的嵌套块的语法上的所有语句都应该共享相同的列表。由于只有一个,我只是在调用indentedBlock
时直接创建了它。
我将结果转换为XML作为读者的练习:-P