用一串长度相同的字符替换RegEx

时间:2013-01-21 21:45:45

标签: python regex

我想用一系列重复字符替换XML标记,这些字符与标记的字符数相同。

例如:

<o:LastSaved>2013-01-21T21:15:00Z</o:LastSaved>

我想将其替换为:

#############2013-01-21T21:15:00Z##############

我们如何才能使用RegEx?

1 个答案:

答案 0 :(得分:12)

re.sub接受替换函数:

re.sub(pattern, repl, string, count=0, flags=0)
     

如果repl是一个函数,则会针对模式的每个非重叠事件调用它。该函数接受一个匹配对象参数,并返回替换字符串。

以下是一个例子:

In [1]: import re

In [2]: def repl(m):
   ...:     return '#' * len(m.group())
   ...: 

In [3]: re.sub(r'<[^<>]*?>', repl,
   ...:     '<o:LastSaved>2013-01-21T21:15:00Z</o:LastSaved>')
Out[3]: '#############2013-01-21T21:15:00Z##############'

我使用的模式可能需要一些抛光,我不确定匹配XML标签的规范解决方案是什么。但是你明白了。