我正在尝试从大型xml文件中提取所有属性值
s = '<some id="Foo" menu="BAAR"></some>'
output = re.findall( '="(.*)"' ,s)
print output
我期待出局
['Foo','BAAR']
但是我得到了
['Foo" menu="BAAR']
任何人都可以帮我指出我做错了吗?
答案 0 :(得分:-1)
在正则表达式中*
是贪婪的,这意味着,它需要尽可能多。只需使用非贪婪版本*?
:
s = '<some id="Foo" menu="BAAR"></some>'
output = re.findall( '="(.*?)"' ,s)
print output