我在下面的pyparsing中编写了一个简单的解析器:
import pyparsing as pp
Token = pp.Word(pp.alphas)("Token")
Modifier = pp.Word(pp.nums)("Modifier")
Random = pp.Group(pp.Keyword("?") + pp.OneOrMore(Modifier))("Random")
Phrase = pp.Group(Token + pp.OneOrMore(Modifier))("Phrase")
Collection = pp.Group(pp.delimitedList(Phrase ^ Random, ","))("Collection")
tree = Collection.parseString("hello 12 2, ? 1 2, word 4, ? 3 4, testing 5")
然后我尝试这样做:
>>> for name, item in tree[0].items():
print name, item
Phrase ['testing', '5']
Random ['?', '3', '4']
...但由于某种原因,它仅返回树中的最后Phrase
和Random
项。我怎样才能得到所有这些?
(注意:我也试过这样做:
>>> for item in tree[0]:
print item
['hello', '12', '2']
['?', '1', '2']
['word', '4']
['?', '3', '4']
['testing', '5']
...但正如您所看到的,它不会返回我需要的令牌名称。我也试过item.name
,但那些总是返回空字符串。)
如何迭代一个pyparsing树并按顺序获取每个项目以及指定的名称?
答案 0 :(得分:3)
ParseResults可以通过调用getName()
来获取其定义名称:
>>> for f in tree[0]: print f.getName(), f.asList()
...
Phrase ['hello', '12', '2']
Random ['?', '1', '2']
Phrase ['word', '4']
Random ['?', '3', '4']
Phrase ['testing', '5']
您还可以恢复使用setResultsName
并将listAllMatches
参数设置为True。在1.5.6版中,expr("name")
快捷方式已得到增强,因此如果名称以“*”结尾,则相当于expr.setResultsName("name", listAllMatches=True)
。以下是通过设置此标志来更改输出的方法:
>>> Random = pp.Group(pp.Keyword("?") + pp.OneOrMore(Modifier))("Random*")
>>> Phrase = pp.Group(Token + pp.OneOrMore(Modifier))("Phrase*")
>>> Collection = pp.Group(pp.delimitedList(Phrase ^ Random, ","))("Collection")
>>> tree = Collection.parseString("hello 12 2, ? 1 2, word 4, ? 3 4, testing 5")
>>> print tree.dump()
[[['hello', '12', '2'], ['?', '1', '2'], ['word', '4'], ['?', '3', '4'], ['testing', '5']]]
- Collection: [['hello', '12', '2'], ['?', '1', '2'], ['word', '4'], ['?', '3', '4'], ['testing', '5']]
- Phrase: [['hello', '12', '2'], ['word', '4'], ['testing', '5']]
- Random: [['?', '1', '2'], ['?', '3', '4']]