删除Notepad ++中的重复字符串

时间:2015-04-09 15:30:50

标签: regex notepad++ duplicate-removal

我试图找到一种方法来删除Notepad ++中的重复字符串(不删除重复的行)。例如,如果我有文字:

爱丽丝最喜欢的冰淇淋(不是意大利冰淇淋)是:香草!爱丽丝最喜欢的冰淇淋(不是意大利冰淇淋)是:香草!请从商店买一些冰淇淋

结果应为

爱丽丝最喜欢的冰淇淋(不是意大利冰淇淋)是:香草!请从商店买一些冰淇淋

我尝试查找一些示例并找到this,但它并没有完全按预期工作。提前谢谢。

2 个答案:

答案 0 :(得分:2)

如果您有连续的重复项,那么您可以使用这样的正则表达式:

(.*)\1

<强> Working demo

并使用替换字符串:\1$1,如屏幕截图中的substitution section所示。

enter image description here

更新:在此评论中指出 1010

  

请注意它可能会匹配重复项,例如“look”中的“o”,或重复字符的句子部分,如“......这是重复的”

您可以通过为最小重复字符创建限制来防止这种情况。例如,这个正则表达式查找具有至少5个重复字符的重复字符(您可以根据您的意图修改数字):

(.{5,})\1

答案 1 :(得分:1)

我只是遇到了类似的问题,想删除重复的行。事实证明,已经有内置功能可以做到这一点。

只需转到“编辑->行操作->删除连续重复的行”。