我试图从300行的小文本文档中删除所有重复的行:
Form
这样:
Outfit
但只删除了一些行,重复项仍然存在,似乎在两种情况下,如果重复项彼此接近,或者相互之间的距离太远。不确定我做错了什么
所有小写的行没有任何标点符号,在单词之间只允许一个空格,并且在字符串中包含最后和第一个空格或标点符号的修剪。
所以如果我一个接一个地得到两个相似的行,这个代码对我来说不起作用,如果一个副本位于其double之前的不同字符串之后,那么就可以工作,如果重复是第7行的顺序并且相等则是第287行,不起作用
答案 0 :(得分:0)
可能行不完全相同,可能有前导/尾随空格。
您可以通过在代表一行的Trim()
个对象上调用string
方法来删除空格:
File.WriteAllLines("doc1.txt", lines.Select(line => line.Trim()).Distinct().ToArray());