RegEx查找所有xml属性值

时间:2016-02-04 17:39:34

标签: python regex

我正在尝试从大型xml文件中提取所有属性值

s = '<some id="Foo" menu="BAAR"></some>'
output = re.findall( '="(.*)"' ,s)
print output

我期待出局

['Foo','BAAR'] 

但是我得到了

['Foo" menu="BAAR']

任何人都可以帮我指出我做错了吗?

1 个答案:

答案 0 :(得分:-1)

在正则表达式中*是贪婪的,这意味着,它需要尽可能多。只需使用非贪婪版本*?

s = '<some id="Foo" menu="BAAR"></some>'
output = re.findall( '="(.*?)"' ,s)
print output