我正在尝试从某些文本中删除wiki格式,以便对其进行解析。
删除两个分隔符('[['和']]')它们之间的所有文本的最pythonic方法是什么?给定的字符串将包含多次出现的分隔符对。
答案 0 :(得分:12)
正则表达式非常适合您的问题。
>>> import re
>>> input_str = 'foo [[bar]] baz [[etc.]]'
如果你想删除整个[[...]]
,我想你在问什么,
>>> re.sub(r'\[\[.*?\]\]', '', input_str)
'foo baz '
如果您想要保留[[...]]
的内容,
>>> re.sub(r'\[\[(.*?)\]\]', r'\1', input_str)
'foo bar baz etc.'