使用Python中的正则表达式替换括号中的所有空格

时间:2013-10-09 15:49:10

标签: python regex

我需要在类似lisp的代码中替换括号之间的所有不必要的空格,如下所示:

(print (number->string (     (func? '+ '-) 12 13 14 15)   )  )

这样就变成了:

(display (number->string ((func? '+ '-) 12 13 14 15)))

我知道一见钟情看起来很简单,但这真的很棘手(至少对我而言)。这里的
我试过的:

In [14]: re.sub(r"\)[ \t]*\)","))",")) ) ",0)
Out[14]: ')) ) '

In [15]: re.sub(r"\)[ \t]*\)","))",") ) ",0)
Out[15]: ')) '

In [16]: re.sub(r"\)[ \t]+\)","))",")) ) ",0)
Out[16]: '))) '

In [17]: re.sub(r"\)[ \t]+\)","))","))  ) ",0)
Out[17]: '))) '

In [18]: re.sub(r"\)[ \t]+\)","))",")   )  ) ",0)
Out[18]: '))  ) '

In [19]: re.sub(r"\)[ \t]+\)","))",")   )  ) ",1)
Out[19]: '))  ) '

In [20]: re.sub(r"\)[ \t]+\)","))",")   )  ) ",0)
Out[20]: '))  ) '

In [21]: re.sub(r"\)[ \t]+\)","))",")   )  ) ",0,re.M)
Out[21]: '))  ) '

In [22]: re.sub(r"\).+\)","))",")   )  ) ",0,re.M)
Out[22]: ')) '

In [23]: re.sub(r"\)\s+\)","))",")   )  ) ",0,re.M)
Out[23]: '))  ) '

In [24]: re.sub(r"\)([ \t]*)\)","))",") ) ",0)
Out[24]: ')) '

In [25]: re.sub(r"\)([ \t]*)\)","",") ) ",0)
Out[25]: ' '

In [26]: re.sub("\)([ \t]*)\)","))",") ) ",0)
Out[26]: ')) '

In [27]: re.sub("\)([ \t]*)\)","))",") ) )",0)
Out[27]: ')) )'

In [28]: re.sub("\)([ \t]*)\)","))",") )       )",0)
Out[28]: '))       )'

In [29]: re.sub("\)([ \t]*?)\)","))",") )       )",0)
Out[29]: '))       )'

In [30]: re.sub("\)(.+?)\)","))",") )       )",0)
Out[30]: '))       )'

在上面的每种情况下,re.sub仅替换第一个括号之间的空格,并使字符串的其余部分保持原样。我需要一个正则表达式来替换所有的空格。

1 个答案:

答案 0 :(得分:2)

你的第一个替换已经“吃掉”了三个结束括号中的两个;因此,右括号的第二对(第二和第三对)不匹配。您会注意到,如果您在示例文本中添加第四个右括号,则第二对之间将删除空格。

您必须在循环中替换(直到没有替换)或使用前瞻断言

re.sub(r"\)[ \t]*(?=\))",")",") )    )",0)

正在做的是匹配 \)[ \t]*但只是“偷看”以检查\) 是否跟随 - 这就是所谓的超前断言。 (还有 lookbehind断言,还有否定前瞻和后瞻断言。)