使用linux命令排序

时间:2015-02-12 06:15:54

标签: linux sorting ubuntu

我的数据如下:

 Sub: Size:14Val: 4644613 Some long string here
 Sub: Size:2Val: 19888493 Some other long string here
 Sub: Size:1Val: 6490281 Some other long string here1
 Sub: Size:1Val: 320829337 Some other long string here2
 Sub: Size:1Val: 50281086 Some other long string here3
 Sub: Size:1Val: 209077847 Some other long string here4
 Sub: Size:3Val: 320829337 Some other long string here2
 Sub: Size:3Val: 50281086 Some other long string here3
 Sub: Size:3Val: 209077847 Some other long string here4

现在我要提取所有尺寸: - 此文件中的信息。那是我想提取以下内容:

Size:14
Size:2
Size:1
Size:1
Size:1
Size:1
Size:3
Size:3
Size:3

我想找出与大小相关的所有值的出现次数。例如。 14按照排序顺序发生一次,2发生一次,1发生四次,等等((i)。按出现次数排序,(ii)按大小相关的值排序))。这需要以排序的方式得到以下结果

(i). sorted by number of occurences
1->4
3->3
2->1
14->1

(ii). sorted by the value associated with Size:
1->4
2->1
3->3
14->1

我写了一个python程序,并能够对它们进行排序。但我在想是否有一些方法可以使用像grep等linux命令来做同样的事情?我使用的是ubuntu 12.04。

1 个答案:

答案 0 :(得分:1)

要提取尺寸字段,

grep -o 'Size:[0-9]*' data

可以使用sort | uniq -c | sort -rn按唯一身份进行排序,您可以对第一个sort进行一些小修改(即添加-t : -k2rn),然后在sort -rn处取消结束按值排序。使用简单的sed脚本可以轻松地将最终输出按摩到您需要的格式。

grep -o 'Size:[0-9]*' data |
sort -t : -k2rn | uniq -c |
sed 's/^ *//;s/\([1-9][0-9]*\) Size:\([0-9]*\)/\2->\1/'