我想提取xml文件中的所有标签。但是,我无法编写正确的正则表达式来提取我想要的内容。
文件中的标签格式如下:
Tags=<"tracffic""apple""sample">
我想返回一个包含所有标签的列表:[traffic,apple,sample]
我试过了:
Tags=<("[\w]+")+
仅返回最后一个标记。
有人能帮我一把吗?
答案 0 :(得分:1)
试试这个:
m = re.search('<(".+")>', 'Tags=<"traffic""apple""sample">')
tags = [x for x in m.group(1).split('"') if x]
现在tags
包含:
['traffic', 'apple', 'sample']