简短版本:
我想创建一个函数,它用正则表达式中的所有命名组替换来自datadict的相应数据。 例如:
Input: expr=r"/(?P<something>\w+)/whatever/(?P<something2>\w+)" data={"something":123, "something2": "thing"}
Output: "/123/whatever/thing"
但我不知道该怎么做。
一些附加信息:
我有代码,它迭代包含名称和模式的元组列表并尝试使用re.search。如果re.search匹配给定字符串,它将从当前元组和groupdict()返回名称(这是来自re.search的数据的dict)。
这是代码
class UrlResolver():
def __init__(self):
self.urls = {}
def parse(self, app, url):
for pattern in self.urls[app]:
data = re.search(pattern[1], url)
if data:
return {"name": pattern[0], "data": data.groupdict()}
现在我想创建函数:
def compose(self, app, name, data):
for pattern in self.url[app]:
if pattern[0] == name:
return string composed from regex expression and data from data dict.
上面的函数应该用来自datadict的相应数据替换所有命名组。
使用Hans Then提供的答案(谢谢!)以及其他一些信息是解决方案:
def _group_replacer(data, match):
data_key = match.group(1)
return data[data_key]
expression = r"\([^\(]*<([^<]*)>[^\(]*\)"
expression = re.compile(expression)
reversed = re.sub(expression, partial(_group_replacer, data), string)
函数“partial”可以从functools导入
答案 0 :(得分:5)
查看re.sub()
功能。可以使用替换函数作为第二个参数调用此函数。见http://docs.python.org/2/library/re.html
你必须定义自己的功能。它必须将匹配对象作为其参数。在其中,您应该查看匹配对象,提取匹配组并将其替换为字典中的值。
您可以通过循环浏览组并在其上调用start, end = span(group)
,从 中需要替换的字符串中提取文本。
编辑
我误解了你原来的问题。我现在看到你不希望从正则表达式替换匹配,而是正则表达式本身。在这种情况下,困难的部分是创建一个匹配命名正则表达式的正则表达式。我的解决方案仍然有效,但可能会更简单一些。
为了做适当的忏悔,我创建了以下示例。
d = { 'something': 'completely',
'something2': 'different' }
def repl(m):
s = m.group(1)
return d[s]
s = "/(?P<something>\w+)/whatever/(?P<something2>\w+)"
p = re.compile(r'\(\?P<(.*?)>\\w\+\)')
print p.sub(repl, s)
这将打印
/completely/whatever/different
答案 1 :(得分:1)
使用方法demonstrated by F.J here,您可以通过以下方式执行替换:
import re
data = {"something" : 123, "something2" : "thing"}
expr = r"/(?P<something>\w+)/whatever/(?P<something2>\w+)"
def matchsub(match, data):
result = list(match.string)
pat = match.re
# print(pat)
for key, index in pat.groupindex.items():
# print(key, index, data[key], match.start(index), match.end(index))
result[match.start(index):match.end(index)] = str(data[key])
return ''.join(result)
result = matchsub(re.search(expr, "hi/ABC/whatever/DEF/there"), data)
print(result)
产量
hi/123/whatever/thing/there