从段落中删除括号内的内容以及括号本身

时间:2012-01-03 13:38:42

标签: python

我需要从一些文本中删除每组括号内的括号和内容。

我想用正则表达式来做这件事。但是,我不知道关于Python的第一件事。

text Direxion是另类投资解决方案的领导者,已任命Angelo Pirri为西北地区新的高级区域总监。 (标识:http://photos.prnewswire.com/prnh/20100701/NY29766LOGO)Pirri先生负责向所有渠道的财务顾问销售和分销Direxion的所有购买和持有替代投资策略产品,包括电线,区域经纪商,注册投资顾问(RIA)和他的领土上的其他人。 Pirri先生将在加利福尼亚州北部,俄勒冈州,华盛顿州,夏威夷州,怀俄明州,爱达荷州,阿拉斯加州和蒙大拿州担任顾问....

摆脱括号内的东西...

我还没有尝试过任何事情......我希望别人告诉我该怎么做,我不想做任何工作。

2 个答案:

答案 0 :(得分:6)

假设没有嵌套括号:

import re

string = 'text (text) text (text) text'

regex = re.compile('\(.+?\)')
output = regex.sub('', string)

print(output)
# >>> text  text  text

答案 1 :(得分:0)

text = "Some sample (with parenthesis) text"
regEx = re.compile(r'([^\(]*)\([^\)]*\) *(.*)')
m = regEx.match(text)
while m:
  text = m.group(1) + m.group(2)
  m = regEx.match(text)
print text

这只是格式化正确的正则表达式以匹配您的文本...上面将迭代地从字符串中删除一组括号,一次一组,但如果您有嵌套的括号则失败。这是一个完全不同的问题。