我想用一系列重复字符替换XML标记,这些字符与标记的字符数相同。
例如:
<o:LastSaved>2013-01-21T21:15:00Z</o:LastSaved>
我想将其替换为:
#############2013-01-21T21:15:00Z##############
我们如何才能使用RegEx?
答案 0 :(得分:12)
re.sub
接受替换函数:
re.sub(pattern, repl, string, count=0, flags=0)
如果
repl
是一个函数,则会针对模式的每个非重叠事件调用它。该函数接受一个匹配对象参数,并返回替换字符串。
以下是一个例子:
In [1]: import re
In [2]: def repl(m):
...: return '#' * len(m.group())
...:
In [3]: re.sub(r'<[^<>]*?>', repl,
...: '<o:LastSaved>2013-01-21T21:15:00Z</o:LastSaved>')
Out[3]: '#############2013-01-21T21:15:00Z##############'
我使用的模式可能需要一些抛光,我不确定匹配XML标签的规范解决方案是什么。但是你明白了。