Notepad ++删除包含重复单词的行

时间:2013-09-12 15:42:39

标签: duplicates notepad++

我有一个.txt文档,其中包含一个单词,后跟一行中的日期,依此类推。

Notepad ++如何识别不同行中的相同单词并删除重复的行?

4 个答案:

答案 0 :(得分:7)

不是您问题的直接答案,但我根据标题找到了这篇文章。我当时想要删除重复的行。我发现了一种简单的方法here

  1. 标记所有文字(CTRL + A)。单击TextFX→单击TextFX工具→选中+排序仅输出UNIQUE(在列)行(如果尚未选中)。
  2. 单击TextFX→单击TextFX工具→单击排序行不区分大小写(在列中)

答案 1 :(得分:2)

假设相同单词的相同出现日期可能不同,并且您希望保留文件中首先出现的日期,那么这应该有效(确保您的文件以新行结束):

  1. 转到“替换”对话框(您可以执行 Ctrl + F 并转到替换标签页。)
  2. 在底部的“搜索模式”中选择“正则表达式”(确保未选中“。匹配换行符”)。
  3. 在“查找内容:”字段中输入(\s*\w+ )(.*\r\n)((.*\r\n)*)\1.*\r\n
  4. 在“替换为:”字段中输入\1\2\3
  5. 点击“替换”直到不再出现(“全部替换”似乎对此不起作用,也许存在一个更好的正则表达式,它可以工作,但我还没有找到它。)
  6. 我在文件上测试了这个:

    testing330     05:09-24/08
    whatever     10:55-25/08
    testing     15:57-26/08
    testing667     19:22-30/08
    linux     00:29-31/08
    testing330     00:29-31/08
    windows     12:25-31/08
    

    结果是:

    testing330     05:09-24/08
    whatever     10:55-25/08
    testing     15:57-26/08
    testing667     19:22-30/08
    linux     00:29-31/08
    windows     12:25-31/08
    

答案 2 :(得分:2)

您可以在Windows上使用EditPlus或在Mac上使用TextWrangler轻松排序和删除重复的行。

Notepad++ 6.5.2(免费)之后,您可以对行进行排序或者您可以使用“插件管理器”安装插件“TextFX Characters”。

  

TextFX包含许多用于转换所选文本的功能。   特点:*交互式支撑匹配*报价处理*字符   案例交替*文字重写*栏目阵容*填写文字*   向下插入计数器文本*文本到代码转换*数字   转换* URI& HTML编码* HTML到文本转换*提交   文本到W3C *文本排序* Ascii图表*领先的空白修复*   自动关闭HTML&大括号主页:http://textfx.no-ip.com/textfx/

答案 3 :(得分:1)

就我个人而言,以下是我遵循的步骤。假设您在A列中只有1列数据。

  1. 将数据导入Excel。
  2. 对数据进行排序。
  3. 插入一个函数以检查重复项。单元格B2将是:= IF(A2 = A1,“Duplicate”,“”)
  4. 选择B列的所有内容。
  5. 复制。
  6. 粘贴特殊并粘贴值。
  7. 根据B列对数据进行排序。
  8. 删除所有标有“复制”的内容。
  9. 将数据复制回Notepad ++
  10. 我以为有这样的插件,但现在找不到它。 Otherwise, this link may help you.