我目前正处理一个文本,我正在努力编辑使用RegEx捕获的内容。
我的文字被分成句子,每个句子有一行。在每一行,我找到使用RegEx;电子邮件,网址,日期等。我希望在不同的正则表达式中识别的空格被替换为“〜”。
以下是我首先使用正则表达式进行捕获的方法:
url = re.compile(ur"((\s|\A)((ht|f)tp(s)?://)?(www\.)?([\w\-\.]+)\.\w+([\w\-\./\?#]+)?\b)", re.I)
if url.search(line):
line = url.sub(ur"{\1}__URL", line)
现在,我找不到用正则表达式捕获的内容用“〜”替换空格的方法。我尝试过诸如替换,re.subs的串联等等。
PS:在一个句子中可能有几件事要被识别。