这是一个简单的例子:
import re
math='<m>3+5</m>'
print re.sub(r'<(.)>(\d+?)\+(\d+?)</\1>', int(r'\2') + int(r'\3'), math)
它给了我这个错误:
ValueError: invalid literal for int() with base 10: '\\2'
它会发送\\2
而不是3
和5
。
为什么呢? 我该如何解决?
答案 0 :(得分:26)
如果要使用re.sub
函数,则需要传递函数,而不是表达式。如文档here所示,您的函数应将匹配对象作为参数并返回替换字符串。您可以使用常用的.group(n)
方法访问这些组,依此类推。一个例子:
re.sub("(a+)(b+)", lambda match: "{0} as and {1} bs ".format(
len(match.group(1)), len(match.group(2))
), "aaabbaabbbaaaabb")
# Output is '3 as and 2 bs 2 as and 3 bs 4 as and 2 bs '
请注意,该函数应返回字符串(因为它们将被放回原始字符串中)。
答案 1 :(得分:7)
您需要使用lambda函数。
print re.sub(r'<(.)>(\d+?)\+(\d+?)</\1>', lambda m: str(int(m.group(2)) + int(m.group(3))), math)