uniq不会清除重复的条目

时间:2015-04-27 23:55:08

标签: osx-yosemite uniq

我有一个文件,每行都有一个数字。我试图找出不同的数字集。以下是摘录:

 550
 400
 4000
 400
 1900
 550
 5000
 400
 1500
 1900
 5000
 4000
 5000
 1900
 5000

然而,通过uniq传递此信息并不会清除所有重复项。行数从256减少到699,但仍有多行400550等。

我使用python脚本生成了这个文件,所以我知道每一行都有一个空格后跟一个数字,然后是\n。至少那是我在代码中打印的内容。

我不明白该文件有什么问题。为什么uniq没有像我想象的那样工作?

(OS X Yosemite,python 2.7

1 个答案:

答案 0 :(得分:2)

在致电sort之前,您需要uniq您的内容,或者您​​可以使用sort -u

来自uniq手册页:

  

uniq - 报告或省略重复的行

请注意它是如何重复而不是重复