PyParsing非贪婪的比赛

时间:2013-04-10 23:53:45

标签: python pyparsing

我正在尝试使用pyparsing将部分标准化的街道地址解析为其组件。我想非贪婪地匹配一个可能是N令牌长的街道名称。

例如:

444 PARK GARDEN LN

应解析为:

number: 444
street: PARK GARDEN
suffix: LN

我如何使用PyParsing执行此操作?这是我的初始代码:

from pyparsing import *

def main():
    street_number = Word(nums).setResultsName('street_number')
    street_suffix = oneOf("ST RD DR LN AVE WAY").setResultsName('street_suffix')
    street_name = OneOrMore(Word(alphas)).setResultsName('street_name')

    address = street_number + street_name + street_suffix
    result = address.parseString("444 PARK GARDEN LN")
    print result.dump()

if __name__ == '__main__':
    main()

但是当我尝试解析它时,街道后缀被默认的贪婪解析行为所吞噬。

1 个答案:

答案 0 :(得分:7)

使用否定~来检查即将到来的street_name是否实际上是street_suffix

from pyparsing import *

street_number = Word(nums)('street_number')
street_suffix = oneOf("ST RD DR LN AVE WAY")('street_suffix')
street_name = OneOrMore(~street_suffix + Word(alphas))('street_name')

address = street_number + street_name + street_suffix
result = address.parseString("444 PARK GARDEN LN")
print result.dump()

此外,你没有 使用setResultsName,你可以简单地使用上面的语法。恕我直言,它导致更清晰的语法定义。