我正在尝试使用pyparsing
将部分标准化的街道地址解析为其组件。我想非贪婪地匹配一个可能是N令牌长的街道名称。
例如:
444 PARK GARDEN LN
应解析为:
number: 444
street: PARK GARDEN
suffix: LN
我如何使用PyParsing执行此操作?这是我的初始代码:
from pyparsing import *
def main():
street_number = Word(nums).setResultsName('street_number')
street_suffix = oneOf("ST RD DR LN AVE WAY").setResultsName('street_suffix')
street_name = OneOrMore(Word(alphas)).setResultsName('street_name')
address = street_number + street_name + street_suffix
result = address.parseString("444 PARK GARDEN LN")
print result.dump()
if __name__ == '__main__':
main()
但是当我尝试解析它时,街道后缀被默认的贪婪解析行为所吞噬。
答案 0 :(得分:7)
使用否定~
来检查即将到来的street_name
是否实际上是street_suffix
。
from pyparsing import *
street_number = Word(nums)('street_number')
street_suffix = oneOf("ST RD DR LN AVE WAY")('street_suffix')
street_name = OneOrMore(~street_suffix + Word(alphas))('street_name')
address = street_number + street_name + street_suffix
result = address.parseString("444 PARK GARDEN LN")
print result.dump()
此外,你没有 使用setResultsName
,你可以简单地使用上面的语法。恕我直言,它导致更清晰的语法定义。