用其他东西替换html文件中的子标记

时间:2015-10-26 18:02:07

标签: python regex

我有一个如下字符串:

 "<sub>1</sub>" ->  "-sub--1--sub-"

我想将标签sub更改为以下内容:

string1 = re.sub('<sub.*>','-sub--',string)
string1 = re.sub('</sub>','--sub-',string)

我试过这个:

{{1}}

但它没有用。

2 个答案:

答案 0 :(得分:2)

re.sub(r"<([^>]*)>([^<]*)<\/([^>]*)>", r"-\1--\2--\3-", string)

答案 1 :(得分:0)

您已经使用了贪婪的运算符.*,其中非贪婪的运算符.*?可以更好地运行。此外,您的第二次更改将覆盖您的第一次更改。 试试这个:

string1 = re.sub('<sub.*?>','-sub--',string)
string1 = re.sub('</sub>','--sub-',string1)

但是,您应该avoid using regex to parse XML。改为使用XML解析器。