我有一个简单的例子,我想解析2行数据。
In [1] from pyparsing import Word, nums, OneOrMore, Optional, Suppress, alphanums, LineEnd, LineStart
Float = Word(nums + '.' + '-')
Name = Word(alphanums)
Line = OneOrMore(Float)('data') + Suppress(Optional(';')) + Optional('%') + Optional(Name)('name')
Lines = OneOrMore(Line + LineEnd())
string = ''' 1 10 0 T20
1 76 0 T76
'''
result = Lines.parseString(string)
In [2] result
Out[2] (['1', '10', '0', 'T20', '\n', '1', '76', '0', 'T76', '\n'], {'data': [(['1', '10', '0'], {}), (['1', '76', '0'], {})], 'name': ['T20', 'T76']})
结果对象包含我需要的所有值,即data
和name
键的值是包含基于行排序的项目的列表。如何从结果对象中获取值?
访问data属性不会同时提供两行
In [3] result.data
Out[3] (['1', '76', '0'], {})
In [4] for i in result.data:
print i
1
76
0
asDict()
方法仅返回第二行
In [5]: result.asDict()
Out[5]: {'data': ['1', '76', '0'], 'name': 'T76'}
asList()
方法会返回单个列表中的所有信息,如果您提前知道name
和data
的长度,则很难枚举
In [6]: result.asList()
Out[6]: ['1', '10', '0', 'T20', '\n', '1', '76', '0', 'T76', '\n']
asXML()
包含我需要的所有内容,但它采用XML格式,文档字符串表示它很快就会被弃用。
In [7]: print result.asXML() # The documentation says this will be deprecated
<data>
<data>1</data>
<ITEM>10</ITEM>
<ITEM>0</ITEM>
<name>T20</name>
<ITEM>
</ITEM>
<data>1</data>
<ITEM>76</ITEM>
<ITEM>0</ITEM>
<name>T76</name>
<ITEM>
</ITEM>
</data>
dump()
再次部分包含相关信息,但它返回一个字符串,并且必须再次解析该字符串以获取信息。
In [8]: print result.dump()
['1', '10', '0', 'T20', '\n', '1', '76', '0', 'T76', '\n']
- data: ['1', '76', '0']
- name: 'T76'
如何以Pythonic方式获得这些值?
答案 0 :(得分:1)
使用结果名称做得很好,在访问已解析的字段时它们非常有用。但听起来你需要在解析器中添加一层结构,这样每一行都会获得自己的数据,名称等。你可以通过重新定义行来实现:
Lines = OneOrMore(Group(Line) + LineEnd().suppress())
现在,如果你打印(result.dump()),你得到:
[['1', '10', '0', 'T20'], ['1', '76', '0', 'T76']]
[0]:
['1', '10', '0', 'T20']
- data: ['1', '10', '0']
- name: 'T20'
[1]:
['1', '76', '0', 'T76']
- data: ['1', '76', '0']
- name: 'T76'
dump()的输出并不是要解析以获取值,而是为了帮助向您展示如何检索结构化值。例如,你可以这样做:
print(result[1].data)
print(result[1].name)
并获取
['1', '76', '0']
T76
或:
for parsed_line in result:
print("{name}: {data}".format_map(parsed_line))
并获得:
T20: ['1', '10', '0']
T76: ['1', '76', '0']