我使用python,我有字符串看起来像这样:
anything include {{infobox notperson anything include new line}}
anything
{{infobox person anything
many new lines and any charachter
}}
anything include {{infobox notperson anything include new line}}
我希望regexp从 {{infobox person 到第一个}} 字符获取整个信息框人区域,这是信息框区域结束。我应该使用什么样的正则表达式?
答案 0 :(得分:0)
您需要使用re.DOTALL
标记才能让.
与换行符匹配:https://docs.python.org/release/3.1.3/library/re.html#re.DOTALL
这是你正在寻找的正则表达式:
re.compile("\{\{infobox person[^\}]*\}\}",re.DOTALL)
编辑,正如Jerry指出的那样,由于DOTALL
已经与换行符匹配,因此无需使用[^\}]
。