我有一个巨大的列表,如下面的例子,需要删除1,3,6和8行,因为它们是部分重复的,所以我需要保持最长的行。
COMPAQ PRESARIO A940ES NOTEBOOK PC COMPAQ PRESARIO A940ES NOTEBOOK PC - KU048EAR HP PAVILION DV7-1210EA NOTEBOOK PC HP PAVILION DV7-1210EA NOTEBOOK PC - NG385EA#ABU HP PAVILION DV7-1210EA NOTEBOOK PC - NG385EAR HP PAVILION DV7-1210ED NOTEBOOK PC HP PAVILION DV7-1210ED NOTEBOOK PC - NA048EA#ABH HP PAVILION DV7-1210ED NOTEBOOK PC - NA048EA
我需要的最终结果是:
COMPAQ PRESARIO A940ES NOTEBOOK PC - KU048EAR HP PAVILION DV7-1210EA NOTEBOOK PC - NG385EA#ABU HP PAVILION DV7-1210EA NOTEBOOK PC - NG385EAR HP PAVILION DV7-1210ED NOTEBOOK PC - NA048EA#ABH
答案 0 :(得分:2)
如果您不需要保留线条的原始序列,您可以尝试这样的事情:
^(.*)\r\n(\1.*?\r\n)
\2
\n
:请使用\n
代替查找内容中的两个\r\n
。工作原理: