我有一个文本文件,其中包含数千行文字,如下所示。
aaaa“ 测试 ”
aa“ 测试 ”(版本2)
bbbb“ 测试 ”(版本4)
bbbbb“ test1 ”(带头)
abs“ test1 ”
absc“ test3 ”
我希望能够根据搜索删除所有重复项并仅保留第一行(在我的情况下,所有行中引号之间的值相同)
编辑:有关我如何检测到某行与另一行重复的更多详细信息: 我检查引号之间的值。在第一行的3行中,引号之间有值“test”,所以我想保留第一行的值并删除其他值。对于第4行和第5行,值为“test1”,因此我只保留第4行并删除另一行。
因此,清理后,我的文本文件将具有此表单
aaaa“测试”
bbbbb“test1”(带头)
absc“test3”
我尝试在记事本++中使用这种常规搜索
(\ “*?”)
但我不知道如何使用它来查找重复项并删除具有相同值的其他行。我已经检查了其他用户的情况,但我找不到解决方案。
答案 0 :(得分:0)
我会分几步解决它。
现在详细说明:
追加行号:使用修改 - >第一列中的列编辑器两次
现在每行应以行号和分隔符
^([^"]*)("[^"]+")(.*)$
\2\1\2\3
("[^"]+")(.*)\n\1.*
\1\2
使用全部替换。^"[^"]+"
^(.*\|)
(使用\ |或在步骤1中使用的任何内容作为分隔符)