使用unix查找文件中最常用的条目

时间:2013-08-20 14:54:00

标签: file unix gnuplot

我有一个包含大约2,000,000个条目的文件 - 只有一列包含许多条目,所有数字。我想快速找出文件中最常见的数字是什么..有没有办法用unix做到这一点? 我知道如何使用gnuplot这样做,但这是一个有点乏味的方式,并想知道是否只是通过使用一些unix命令更简单的方法? 就像我的文件是

1
1
1
2
3
4

然后我想让它读取文件并给我答案1,因为那是最常见的。

3 个答案:

答案 0 :(得分:6)

你可以这样做:

$ cat file|sort -n|uniq -c|sort -n|tail -n 1|awk '{print $2}'

答案 1 :(得分:3)

sort test.txt | uniq -c | sort -rn | head -n 1应该有所帮助。它会打印出现次数和最常用的数字,因此对于您的示例文件,它将是:3 1

答案 2 :(得分:0)

我的第一个答案是构建直方图。如果可能值的范围足够小,它会有所帮助。

构建直方图后,只需查看其中的最高数量。