Question

我有一个包含大约2,000,000个条目的文件 - 只有一列包含许多条目，所有数字。我想快速找出文件中最常见的数字是什么..有没有办法用unix做到这一点？我知道如何使用gnuplot这样做，但这是一个有点乏味的方式，并想知道是否只是通过使用一些unix命令更简单的方法？就像我的文件是

然后我想让它读取文件并给我答案1，因为那是最常见的。

Answer 1

你可以这样做：

$ cat file|sort -n|uniq -c|sort -n|tail -n 1|awk '{print $2}'

Answer 2

sort test.txt | uniq -c | sort -rn | head -n 1应该有所帮助。它会打印出现次数和最常用的数字，因此对于您的示例文件，它将是：3 1

Answer 3

我的第一个答案是构建直方图。如果可能值的范围足够小，它会有所帮助。

构建直方图后，只需查看其中的最高数量。