我有一个表格格式的大数据文件需要分析。主要有两列是我感兴趣的,其中一列包含字母数字字母(第1列),另一列包含百分比数字(第3列)。
我的要求是根据第3列的值反向排序数据,应用一些阈值(> 10.0)并仅按排序顺序显示符合此条件的所需行,第1列和第3列。
通常我会编写一个小perl
脚本来实现这样的要求。但在这里,我正在寻找一系列linux命令(一个班轮)来快速有效地解决它。
示例输入
abc12 24.5 90.0 5
xyz23 454.23 23.5 2
aa34cd 1.345 12.34 6
uvxy 4.25 54.7 1
pqr3t 235.3 6.05 4
abcd 1.234 4.56 3
所需输出
abc12 90.0
uvxy 54.7
xyz23 23.5
aa34cd 12.34
如果你能帮助我解决这个问题,那将会很明显。
我尝试了什么?
我可以使用以下命令对#3列进行反向排序。不确定下一步是什么!
awk '{print $3}' test.txt | sort -rn
答案 0 :(得分:5)
如果第三个字段大于10,则仅打印第一个和第三个字段,然后在第二个字段上执行数字逆序排序:
$ awk '$3>10{print $1,$3}' file | sort -nrk 2
abc12 90.0
uvxy 54.7
xyz23 23.5
aa34cd 12.34