基于特定列的排序,阈值和显示表数据

时间:2013-09-27 07:50:06

标签: sorting sed awk grep

我有一个表格格式的大数据文件需要分析。主要有两列是我感兴趣的,其中一列包含字母数字字母(第1列),另一列包含百分比数字(第3列)。

我的要求是根据第3列的值反向排序数据,应用一些阈值(> 10.0)并仅按排序顺序显示符合此条件的所需行,第1列和第3列。

通常我会编写一个小perl脚本来实现这样的要求。但在这里,我正在寻找一系列linux命令(一个班轮)来快速有效地解决它。

示例输入

abc12   24.5     90.0    5  
xyz23   454.23   23.5    2
aa34cd  1.345    12.34   6
uvxy    4.25     54.7    1
pqr3t   235.3    6.05    4
abcd    1.234    4.56    3

所需输出

abc12   90.0
uvxy    54.7
xyz23   23.5
aa34cd  12.34

如果你能帮助我解决这个问题,那将会很明显。

我尝试了什么?

我可以使用以下命令对#3列进行反向排序。不确定下一步是什么!

awk '{print $3}' test.txt | sort -rn

1 个答案:

答案 0 :(得分:5)

如果第三个字段大于10,则仅打印第一个和第三个字段,然后在第二个字段上执行数字逆序排序:

$ awk '$3>10{print $1,$3}' file | sort -nrk 2
abc12    90.0
uvxy     54.7
xyz23    23.5
aa34cd   12.34