删除逗号之前开头有重复单词的行

时间:2013-12-10 09:14:41

标签: vb.net text replace notepad++ comma

欢迎,

这是文本文件

  

Soma,ID 6588,1988

     

Lara,ID 4652,1995

     

John,ID 1098,1987

     

Soma,ID 7898,1998

     

John,ID 1024,1996

我想在第一个逗号之前删除任何以重复单词开头的行。

所以文字将是:

  

Soma,ID 6588,1988

     

Lara,ID 4652,1995

     

John,ID 1024,1996

订单不是必需的。

任何想法?

使用:notepad ++,vb.net。

3 个答案:

答案 0 :(得分:1)

不需要VB.net,正则表达式可以做到这一点。

  1. 使用notepad ++打开文本文件
  2. 按CTRL + H
  3. 显示替换窗口
  4. 在“查找内容”中,输入(^[^,]+).+\r\n((.|\r\n)+)\1
  5. 在“替换为”中,输入\2\1
  6. 在“搜索模式”中,选择“正则表达式”
  7. 点击“全部替换”按钮几次,直到更换0次
  8. 你得到了你想要的东西。

答案 1 :(得分:0)

您可以尝试将每行添加到dictionary。使用逗号前面的部分作为键,将行的其余部分作为数据。然后,您可以在每次使用.ContainsKey方法添加新行时进行检查,以查看该行是否已存在。教程是here

答案 2 :(得分:0)