我有一个包含大约2,000,000个条目的文件 - 只有一列包含许多条目,所有数字。我想快速找出文件中最常见的数字是什么..有没有办法用unix做到这一点? 我知道如何使用gnuplot这样做,但这是一个有点乏味的方式,并想知道是否只是通过使用一些unix命令更简单的方法? 就像我的文件是
1
1
1
2
3
4
然后我想让它读取文件并给我答案1,因为那是最常见的。
答案 0 :(得分:6)
你可以这样做:
$ cat file|sort -n|uniq -c|sort -n|tail -n 1|awk '{print $2}'
答案 1 :(得分:3)
sort test.txt | uniq -c | sort -rn | head -n 1
应该有所帮助。它会打印出现次数和最常用的数字,因此对于您的示例文件,它将是:3 1
答案 2 :(得分:0)
我的第一个答案是构建直方图。如果可能值的范围足够小,它会有所帮助。
构建直方图后,只需查看其中的最高数量。