从文本文档中删除所有重复的行

时间:2016-11-11 22:21:21

标签: c# string duplicates

我试图从300行的小文本文档中删除所有重复的行:

Form

这样:

Outfit

但只删除了一些行,重复项仍然存在,似乎在两种情况下,如果重复项彼此接近,或者相互之间的距离太远。不确定我做错了什么

所有小写的行没有任何标点符号,在单词之间只允许一个空格,并且在字符串中包含最后和第一个空格或标点符号的修剪。

所以如果我一个接一个地得到两个相似的行,这个代码对我来说不起作用,如果一个副本位于其double之前的不同字符串之后,那么就可以工作,如果重复是第7行的顺序并且相等则是第287行,不起作用

1 个答案:

答案 0 :(得分:0)

可能行不完全相同,可能有前导/尾随空格。

您可以通过在代表一行的Trim()个对象上调用string方法来删除空格:

File.WriteAllLines("doc1.txt", lines.Select(line => line.Trim()).Distinct().ToArray());