使用RegEx从文本文件中删除重复的字符串

时间:2013-01-15 20:05:55

标签: regex string duplicates

我想从一个文件中删除字符串,该文件已存在于起诉RegEx(注释++)的数字较少的行中。

示例 -

123   = 45,
789 = 321,
123     =   951

应该导致 -

123   = 45,
789 = 321,
     =   951

1 个答案:

答案 0 :(得分:1)

嗯,这是一个很好的例子,虽然RegEx非常强大,但它并不总是适合这项工作的工具。例如,以下RegEx可能会执行您想要的操作(我没有安装Notepad ++,但它可以在我的RegEx客户端中运行)

Search: (\b\d+\b)(.+?)\1
Replace: \1\2 (or $1$2, depending on your setup)

这是一个数字的实例,搜索直到找到它的另一个实例,然后用自己替换整个事物减去第二个实例。

然而,除了非常脏之外,使用快速脚本甚至像Excel这样的东西会更简单。