如何从PyParsing中的结果对象中检索值列表?

时间:2016-11-18 00:34:57

标签: python pyparsing

我有一个简单的例子,我想解析2行数据。

In [1] from pyparsing import Word, nums, OneOrMore, Optional, Suppress, alphanums, LineEnd, LineStart

       Float = Word(nums + '.' + '-')
       Name = Word(alphanums)
       Line = OneOrMore(Float)('data') + Suppress(Optional(';')) + Optional('%') + Optional(Name)('name')

       Lines = OneOrMore(Line + LineEnd())

       string = ''' 1   10  0       T20
            1   76  0   T76
       '''
       result = Lines.parseString(string)

In [2] result
Out[2] (['1', '10', '0', 'T20', '\n', '1', '76', '0', 'T76', '\n'], {'data': [(['1', '10', '0'], {}), (['1', '76', '0'], {})], 'name': ['T20', 'T76']})

结果对象包含我需要的所有值,即dataname键的值是包含基于行排序的项目的列表。如何从结果对象中获取值?

访问data属性不会同时提供两行

In [3] result.data
Out[3] (['1', '76', '0'], {})

In [4] for i in result.data:
           print i
       1
       76
       0

asDict()方法仅返回第二行

In [5]: result.asDict()
Out[5]: {'data': ['1', '76', '0'], 'name': 'T76'}

asList()方法会返回单个列表中的所有信息,如果您提前知道namedata的长度,则很难枚举

In [6]: result.asList()
Out[6]: ['1', '10', '0', 'T20', '\n', '1', '76', '0', 'T76', '\n']

asXML()包含我需要的所有内容,但它采用XML格式,文档字符串表示它很快就会被弃用。

In [7]: print result.asXML() # The documentation says this will be deprecated
        <data>
          <data>1</data>
          <ITEM>10</ITEM>
          <ITEM>0</ITEM>
          <name>T20</name>
          <ITEM>
        </ITEM>
          <data>1</data>
          <ITEM>76</ITEM>
          <ITEM>0</ITEM>
          <name>T76</name>
          <ITEM>
        </ITEM>
        </data>

dump()再次部分包含相关信息,但它返回一个字符串,并且必须再次解析该字符串以获取信息。

In [8]: print result.dump()
        ['1', '10', '0', 'T20', '\n', '1', '76', '0', 'T76', '\n']
        - data: ['1', '76', '0']
        - name: 'T76'

如何以Pythonic方式获得这些值?

1 个答案:

答案 0 :(得分:1)

使用结果名称做得很好,在访问已解析的字段时它们非常有用。但听起来你需要在解析器中添加一层结构,这样每一行都会获得自己的数据,名称等。你可以通过重新定义行来实现:

Lines = OneOrMore(Group(Line) + LineEnd().suppress())

现在,如果你打印(result.dump()),你得到:

[['1', '10', '0', 'T20'], ['1', '76', '0', 'T76']]
[0]:
  ['1', '10', '0', 'T20']
  - data: ['1', '10', '0']
  - name: 'T20'
[1]:
  ['1', '76', '0', 'T76']
  - data: ['1', '76', '0']
  - name: 'T76'

dump()的输出并不是要解析以获取值,而是为了帮助向您展示如何检索结构化值。例如,你可以这样做:

print(result[1].data)
print(result[1].name)

并获取

['1', '76', '0']
T76

或:

for parsed_line in result:
    print("{name}: {data}".format_map(parsed_line))

并获得:

T20: ['1', '10', '0']
T76: ['1', '76', '0']