如何编写正则表达式来提取标签?

时间:2011-11-29 20:10:49

标签: python regex

我想提取xml文件中的所有标签。但是,我无法编写正确的正则表达式来提取我想要的内容。

文件中的标签格式如下:

 Tags=<"tracffic""apple""sample">

我想返回一个包含所有标签的列表:[traffic,apple,sample]

我试过了:

    Tags=<("[\w]+")+

仅返回最后一个标记。

有人能帮我一把吗?

1 个答案:

答案 0 :(得分:1)

试试这个:

m = re.search('<(".+")>', 'Tags=<"traffic""apple""sample">')
tags = [x for x in m.group(1).split('"') if x]

现在tags包含:

['traffic', 'apple', 'sample']