我有一个TAB格式的500 000行文本文件(不同俱乐部成员的地址)(使用空格而不是TAB,所以所有列都在其中)。
有些线几乎相同(只有一列不同 - 一个人可以成为2个俱乐部的成员)。我不关心删除哪个重复行,因为家庭地址是相同的,但我需要删除其中一个。
我可以在EXCEL中找到重复项(TEXT-TO-CELL并删除它们。但是然后丢失文本模式和colums,因为格式不是TAB和CSV格式。
如何在NOTEPAD ++或TEXTPAD中编写和使用正则表达式?
答案 0 :(得分:0)
我的解决方案:
完成!