我有一个文件,每行都有一个数字。我试图找出不同的数字集。以下是摘录:
550
400
4000
400
1900
550
5000
400
1500
1900
5000
4000
5000
1900
5000
然而,通过uniq
传递此信息并不会清除所有重复项。行数从256
减少到699
,但仍有多行400
或550
等。
我使用python脚本生成了这个文件,所以我知道每一行都有一个空格后跟一个数字,然后是\n
。至少那是我在代码中打印的内容。
我不明白该文件有什么问题。为什么uniq
没有像我想象的那样工作?
(OS X Yosemite,python 2.7
)
答案 0 :(得分:2)
在致电sort
之前,您需要uniq
您的内容,或者您可以使用sort -u
。
来自uniq
手册页:
uniq - 报告或省略重复的行
请注意它是如何重复而不是重复。