标签: regex replace
我搜索了正则表达式从文本中删除引文(它们在语音朗读软件中听起来很奇怪)。
我想从文本中删除所有形式的引文
(作者,2000),(作者,印刷中)
和
(作者的东西,2004,作者2 2005)
但同时不能删除大括号中的普通文本,也不能删除。 (图3)(这可能对读者有帮助。)
带引文的文字示例:http://journal.frontiersin.org/article/10.3389/fnhum.2014.00114/full
答案 0 :(得分:0)
我更好:
\([^\)]*,[^\)]*\)
参见 LiveDemo
答案 1 :(得分:0)
我使用的是here:
r"([A-Z][\w\-]+ )?\((\D*\d{4}(: ?[\d\-]*)*(, \d{4}(: ?[\d\-]*)*)*;?)*\)"
答案 2 :(得分:-1)
我找到的最好的是
[\(].?[^\)]*?[\d\d\d\d]{1}.*?[\)]{1}
它可能不是最佳的,因为它选择(1)在某些情况下可能不是读者想要的,但仍然接近最佳。