正则表达式删除引文

时间:2015-11-17 15:23:58

标签: regex replace

我搜索了正则表达式从文本中删除引文(它们在语音朗读软件中听起来很奇怪)。

我想从文本中删除所有形式的引文

  

(作者,2000),(作者,印刷中)

  

(作者的东西,2004,作者2 2005)

但同时不能删除大括号中的普通文本,也不能删除。 (图3)(这可能对读者有帮助。)

带引文的文字示例:http://journal.frontiersin.org/article/10.3389/fnhum.2014.00114/full

3 个答案:

答案 0 :(得分:0)

我更好:

\([^\)]*,[^\)]*\)

参见 LiveDemo

答案 1 :(得分:0)

我使用的是here

r"([A-Z][\w\-]+ )?\((\D*\d{4}(: ?[\d\-]*)*(, \d{4}(: ?[\d\-]*)*)*;?)*\)"

答案 2 :(得分:-1)

我找到的最好的是

[\(].?[^\)]*?[\d\d\d\d]{1}.*?[\)]{1}

它可能不是最佳的,因为它选择(1)在某些情况下可能不是读者想要的,但仍然接近最佳。